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FIEBRE  HEMORRAGICA  ARGENTINA.  OTRA  MIRADA  HISTÓRICA 

(Ciencia  y tecnología) 


Norma  Isabel  Sánchez  1 
Sandra  Janete  Inwentarz  2 


' Profesora  adjunta  de  Historia  de  la  Medicina  y directora  el  Observatorio  de  Historia  de  la  Medicina,  del  Instituto  y 
Cátedra  de  Historia  de  la  Medicina.  Departamento  de  Humanidades  Médicas  (FM/UBA).  Ce:  akohnlon@fmed.uba.ar 

2 Del  Departamento  de  Neumonología.  Instituto  Profesor  Doctor  Raúl  Vaccarezza.  Cátedra  de  Medicina  Respiratoria. 
Ce:  sandrainwentarz@yahoo.com. ar 

La  co-autora  expresa  un  sincero  agradecimiento  a la  familia  Barrera  Oro  por  los  datos  suministrados.  A Leónidas  As- 
drúbal  Barrera  Oro  por  las  horas  dedicadas  a relatar  lo  sucedido  en  aquellos  años  difíciles,  a mostrar  algunos  de  los 
manuscritos  de  su  hermano  y anotaciones  personales  que  atesora.  A Gabriel  F Barrera  Oro  por  el  tiempo  que  ocupó 
buscando  datos,  escritos  y recortes  de  periódicos. 

RESUMEN 

La  Fiebre  Hemorrágica  Argentina  (FHA),  es  producida  por  un  arenavirus  conocido  corno  virus  Junin.  que 
tiene  la  particularidad  de  establecer  infecciones  crónicas  en  un  roedor,  el  Calomys  musculinus.  que  trans- 
mite la  enfermedad  a través  del  contacto  del  hombre  con  su  saliva,  orina,  sangre  o sus  partículas  aerosol- 
izadas.  La  zona  endémica  cubre  aproximadamente  1 50.000  km2,  comprometiendo  las  provincias  de  Buenos 
Aires,  Córdoba.  Santa  Fe,  Entre  Ríos  y de  La  Pampa,  con  una  población  estimada  en  riesgo  de  5 millones. 
Los  primeros  afectados  se  registran  a partir  del  tramo  final  de  la  década  de  1940:  pero,  sólo  alrededor  de 
1955  toma  mayor  notoriedad,  cuando  el  número  de  casos  aumenta.  Es  entonces  cuando  un  grupo  de  inves- 
tigadores se  dirigen  hacia  allí,  tratando  de  paliar  la  situación.  Sobresale  entre  ellos  Julio  Guido  Barrera  Oro. 
viróloeo  del  Instituto  Malbrán,  quien  ante  la  incertidumbre  acerca  del  origen  de  esta  enfermedad  decide 
autoinocularse  tratando  de  encontrar  una  respuesta.  Después  de  variadas  vicisitudes,  todo  culminó  con  el 
descubrimiento  de  una  vacuna  para  proteger  a la  población  zonal. 


Palabras  claves:  Fiebre  Hemorrágica  Argentina:  mal  de  los  rastrojos:  mal  de  OTIiggins;  virus  Junín: 
Gandid  I;  Julio  Guido  Barrera  Oro. 


BREVE  DETALLE  DE  LA  ENFERMEDAD 

En  estas  páginas  reseñaremos,  de  manera  resumida,  las  características  de  la  dolencia,  de  qué  manera  fue 
hallado  el  tratamiento  (con  plasma  del  enfermo  convaleciente)  y cómo  se  llegó  a la  fabricación  de  la  va- 
cuna, a partir  de  los  relatos  de  los  familiares  de  Julio  Guido  Barrera  Oro.  uno  de  tos  protagonistas  de  esta 
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historia. 

La  Liebre  Hemorrágica  Argentina  (FHA),  localmente  denominada  "mal  de  los  rastrojos"  o "mal  de 
O Miggins”,  es  una  fiebre  hemorrágica  viral,  zoonótica,  causada  por  el  virus  Junín,  un  arenavirus,  muy 
relacionado  con  el  v irus  Machupo  (agente  causante  de  la  fiebre  hemorrágica  boliviana).  Su  vector  es  una 
especie  de  roedor,  la  laucha  del  maíz  o ratón  maicero  (Calomys  musculinus).  que  lo  desparrama  a través  de 
su  saliva,  orina  o sangre  \ entra  en  contacto  con  el  humano  por  la  piel  (a  través  de  escoriaciones  o heridas); 
las  mucosas  (conjuntival,  oral:  el  clásico  morder  hebras  de  hierba  o palitos);  la  inhalación  de  partículas 
aerosolizadas  portadoras  del  virus. 

La  zona  endémica  cubre  cerca  de  150.000  km*  comprometiendo  las  provincias  de  Buenos  Aires,  Córdoba. 
Santa  Le,  Lntre  Ríos  y de  La  Pampa,  con  una  población  estimada  en  riesgo  de  5 millones.  Se  produce  prin- 
cipalmente entre  personas  que  residen,  \ isitan  o trabajan  en  el  medio  rural  (más  frecuente  en  este  último 
caso);  el  SO  "ó  de  los  infectados  son  hombres  entre  15  y 60  años.  De  febrero  a mayo  de  cada  año,  cuando 
el  laboreo  agrícola  es  intenso,  pueden  ocurrir  miles  de  casos,  con  una  tasa  de  mortalidad  global  de  10  a 

Ij  /o  . 


Lnfermedad  aguda  que  comienza  como  un  simple  cuadro  gripal,  con  un  período  de  incubación  de  cerca 
de  10  días  y los  primeros  síntomas  que  se  presentan  son:  tlebre  alta,  malestar  general,  astenia,  fotofobia, 
cefaleas,  dolor  retroocular,  anorexia,  náuseas,  mareos.  En  el  examen  tísico  se  observa  un  exantema  er- 
itematoso  localizado  en  la  cara,  el  cuello  y el  tronco,  petequias  en  la  piel,  congestión  generalizada  de  la  mu- 
cosa oral  y adenopatías4.  Predominan  los  cuadros  hemorrágicos  con  hematemesis,  melena,  hemoptisis  y/o 
hematuria.  En  casos  severos,  aparecen  síntomas  neurológicos  entre  el  y 8°  día.  con  ataxia,  hipersomnia 
o insomnio,  temblores  especialmente  de  la  lengua  y convulsiones  tónico-clónicas.  Los  fenómenos  hemor- 
rágicos tanto  macro  como  microscópicos  son  constantes  y se  pueden  ver  en  casi  todos  los  órganos  (bazo, 
pulmón,  corazón,  ganglios  linfáticos,  intestino,  etc):  la  médula  ósea  muestra  depleción  de  las  3 series, 
especialmente  la  eritroide.  Lodos  estos  fenómenos  se  producen  tanto  por  agresión  viral  directa  como  por 
coagulación  intravascular  diseminada,  manifestada  por  la  presencia  de  trombos  tlbrinosos  intravasculares. 
También  por  afección  viral  directa  se  origina  una  miocarditis  intersticial  con  un  infiltrado  linfocitario  entre 
las  fibras  miocárdieas,  membranas  hialinas  pulmonares,  necrosis  de  las  papilas  renales,  cuerpos  acidóla  los 
hepáticos  con  necrosis  hepática  focal.  Todo  esto  lleva  al  paciente  a padecer  procesos  infecciosos  secundar- 
ios, al  shock  irreversible,  coma  y muerte  \ 6 . 


La  enfermedad  también  puede  presentarse  en  forma  más  leve  y.  en  ocasiones,  el  enfermo  ignora  que  la  ha 
padecido,  pues  tiene  muchas  similitudes  con  el  síndrome  gripal,  con  mandato  de  los  síntomas  gástricos  y 
se  podría  hablar  de  una  forma  tífica,  que,  en  caso  de  agravarse  y predominar  las  formas  vasculares,  podría 
denominarse  enfermedad  tífico-vascular.  Nunca  la  enfermedad  es  pura;  en  caso  que  domine  la  afectación 
del  sistema  nervioso,  forma  tífica-nerv losa.  Es  decir,  se  expresa  bajo  3 formas:  leve,  moderadamente  grave 
y grave,  todas  con  manifestaciones  bucales:  hay  enrojecimiento  de  las  fauces,  a veces  un  ribete  eritema- 
toso  contornea  los  dientes:  en  la  cara  posterior  de  los  labios  y en  la  mucosa  que  tapiza  la  cara  interna  de 
las  mejillas  existe,  con  frecuencia,  una  red  capilar  rojo  vinosa;  se  acompaña  de  piqueteado  equimótico, 
más  atenuado  en  la  parte  posterior  de  la  boca,  pilares  anteriores,  base  de  la  úvula  y paladar  blando  (en  este 
aparecen  20  a 30  microvesículas  de  contenido  claro).  Este  enantema  bucal,  signo  importantísimo  para  el 
diagnostico  diferencial,  no  está  acompañado  por  ganglios  de  la  región  subángulo  maxilar  ni  tampoco  por 
odinofagia.  Los  pacientes  tragan  sin  dificultad.  La  lengua  que  al  principio  es  saburral.  con  la  evolución  de 
la  enfermedad,  se  torna  seca,  aporcelanada  ("lengua  de  loro"  o "lengua  tífica")  y,  al  ser  proyectada  fuera 
de  la  boca,  tiene  un  "temblor"',  tanto  más  grosero  cuando  más  grave  es  la  evolución  y está  en  relación  con 
los  síntomas  encefal ¡ticos  que  acompañan.  La  halitosis  es  muy  acentuada  y la  gingivorragia  está  en  todos 
los  pacientes. 

Las  formas  graves  evolucionan  hacia  un  importante  porcentaje  de  desenlace  fatal.  Los  enfermos  presen- 
tan acentuado  delirio,  tics,  convulsiones,  gritos  incoordinados,  síntomas  psicóticos  y coma,  seguido  de 


muerte. 
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UN  POCO  DE  HISTORIA 
1943 

Es  posible  que  los  primeros  casos,  de  que  se  tenga  noticias,  sean  de  este  año  cuando  un  número  mas  o 
menos  significativo  de  pobladores  de  la  zona  noroeste  de  la  provincia  de  Buenos  Aires  (partidos  de  9 de 
Julio,  Bragado.  Junín,  General  Viamonte,  Chacabuco,  Rojas),  padecieron  "gripe  con  fiebre  muy  alta  y un 
60%  de  mortalidad,  llamada  -por  los  lugareños-  "la  fiebre”*. 

1955 

Momento  inicial  de  la  comunicación  oficial,  realizada  por  Rodolfo  Arribalzaga7,  jete  de  la  Sala  de  In- 
fecciosas del  Hospital  de  Bragado.  En  su  trabajo  publicado  por  El  Día  Médico,  de I 16  de  junio  de  1955, 
describió  una  serie  de  casos  que  cursaban  como  un  tipo  de  "gripe'’,  con  hipertermia,  exantema,  enantema. 
nefroto.xicidad  y leucopenia  y solicitó,  por  lo  tanto,  la  presencia  de  especialistas  de  Buenos  Aires  para 
su  resolución.  Se  supo  posteriormente  que  sus  reclamos  no  fueron  verificados;  en  realidad  era  una  pésima 
oportunidad  para  prestarle  atención  pues  el  país  vivía  momentos  de  incertidumbre  con  un  nuevo  intento  de 
levantamiento  militar  que  buscaba  derrocar  al  presidente  Perón  que,  meses  más  tarde,  en  electo,  se  concre- 
taría (setiembre  de  1955).  para  dar  paso  a la  denominada  Revolución  Libertadora. 

1956-1957 

Durante  este  periodo  el  país  vive  momentos  de  alta  intolerancia  política;  los  tres  poderes  del  Estado  están 
intervenidos  y,  en  medio  de  situaciones  de  inestabilidad,  poca  trascendencia  se  brindó  a ciertos  temas, 
como  el  que  nos  ocupa.  Sin  embargo  (como  explicamos,  líneas  abajo,  en  otro  apartado)  se  le  dio  torma  al 
Instituto  Nacional  de  Microbiología  (1NM),  con  tempranos  laboratorios  de  biología  molecular  e Ignacio 
Pirosky  va  a cumplir  una  labor  destacada,  mientras  incorpora  investigadores  de  la  talla  de  Julio  Barrera 
Oro,  Julio  1 Maiztegui.  César  y Celia  Milstein,  Armando  S Parodi.  Eugenia  Sacerdote  de  Lustig.  Juan  A 
Zuccarini  y muchos  otros. 


1958 

El  Io  de  mayo  Arturo  Frondizi  toma  la  conducción  del  país  y hay  un  intento  de  mejorar  o redireccionar 
situaciones  anómalas.  En  su  gabinete,  Héctor  V.  Noblía  es  el  responsable  del  área  de  salud. 

Por  entonces,  muchos  médicos  zonales  se  enterarían  de  esta  enfermedad,  a través  de  los  artículos  publica- 
dos por  el  diario  La  Razón10 ,"  ,12  y,  ante  la  reiteración  de  casos,  la  zona  afectada  fue  visitada  por  más  de 
una  comisión  específica:  una  Médica  Militar,  otras  de  la  UBA,  del  Instituto  Nacional  de  Microbiología 
Carlos  Malbrán  y del  instituto  Biológico  de  la  provincia  de  Buenos  Aires.  Un  testigo  de  la  época  nos 
relató: 


"Se  tomó  un  nido  de  ratones  maiceros  y se  lo  trasladó  a Buenos  Aires.  Se  colocó  en  los  mismos,  lauchas 
lactantes  que  al  ser  picadas  por  los  ácaros.  enfermaron  con  características  similares  a los  seres  humanos  en- 
fermos. Además  se  inocularon  animales  de  laboratorio  con  solución  fisiológica  que  contenía  ácaros  mach- 
acados, enfermando  también  estos  animales... 

Sin  embarco  el  ciclo  roedor-ácaro-hombre  está  en  pleno  estudio 


Va  a resultar  un  año  muy  significativo  y entra  en  escena  nuestro  protagonista  principal.  Julio  Barrera  Oro. 
quien  expresó  oportunamente: 

’’EI  9 1 de  junio  ...  fui  a Junín.  como  integrante  de  la  Comisión  Nacional  "ad  hoc”  nombrada  por  el  Señor 
Ministro  de  Asistencia  Social  y Salud  Pública.  Dr  Noblía.  y formada  por  el  jefe  de  ella.  Dr  Pirosky.  y por 
los  doctores  Molinelli,  Zuccarini  y Di  Pietro,  que  también  tenían  a su  cargo  tareas  directrices;  el  Dr  De 
León,  que  estudiaba  la  parte  epidemiológica;  el  Dr  Bernabé  Ferreira.  especialista  en  Virología;  y el  señor 
Teodomiro  Vázquez,  Entomólogo,  jefe  del  equipo  de  campo  que  comandaba  el  grupo  de  desratizadores, 
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cuyo  capataz,  señor  Díaz,  tuvo  la  desgracia  de  enfermar  allí  del  "Mal  de  los  Rastrojos". 

1.1  l)r  Pedro  Martini,  el  estudiante  de  medicina  F Gutman  Frugoni  y yo  trabajábamos  en  el  laboratorio, 
en  todo  lo  concerniente  a exámenes  de  sangre  y otras  muestras  extraídas  de  los  enfermos,  buscando  al 
agente  patógeno  de  la  enfermedad  en  cuestión  ... 

Quiero  dejar  constancia  de  mi  agradecimiento  al  señor  Francisco  Gianelli.  quien  nos  preparaba  los  materia- 
les de  trabajo,  pues  sin  sus  servicios,  nos  hubiera  resultado  dificultosa  nuestra  tarea  ...*'14. 

Líneas  más  abajo  vamos  a completar  esta  información.  Fran  meses  en  que  se  trabajaba  en  las  zonas  afecta- 
das recopilando  datos  y todo  material  que  resultase  provechoso  con  el  propósito  de  "entender"  la  enferme- 
dad. aislar  al  agente  etiológico  y encontrar  así  un  tratamiento  efectivo. 

Continúa  diciendo: 

"Va  en  Buenos  Aires,  por  razones  circunstanciales,  recavó  en  mi  el  honor  de  recibir  en  el  Instituto  Nacio- 
nal de  Microbiología  al  doctor  Earl  Chamberlain,  consultor  de  la  Oficina  Sanitaria  Panamericana  ... 

Al  observar  los  resultados  logrados  hasta  entonces  por  nuestro  equipo,  resumió  su  opinión  en  un  Too 
Good',  que  yo  no  supe  bien  si  era  admirativo  o escéptico.  Entonces  replique  al  ilustre  visitante  que  nuestras 
investigaciones  no  serían  publicadas  mientras  no  pudiera  producirse  la  enfermedad  en  el  hombre,  experi- 
mentalmente ... 

A comienzos  de  diciembre,  las  pruebas  efectuadas  por  nuestro  equipo  habían  permitido  determinar  ya.  de 
un  modo  irrefutable,  mediante  el  proceso  de  ultrall Itración.  que  habíamos  aislado  un  virus,  y los  ensayos 
serológicos  hacían  suponer,  con  amplio  márgen  de  seguridad,  que  ese  virus  era  el  agente  causal  del  mal 
de  los  rastrojos'... 

Faltaba  la  prueba  más  concluyente:  provocar  la  enfermedad  en  el  hombre,  experimentalmente  ... 

Comencé  a acariciar  la  idea  de  la  autoinoculación  ...Tenía  muchas  dudas  al  respecto  ...  las  consecuencias 
sobre  mi  familia  ...  razones  de  disciplina  ... 

Comencé  a hablar  de  ello  con  algunos  compañeros  y todos  trataban  de  disuadirme.  Solamente  logré  con- 
vencer de  la  necesidad  de  esta  prueba  a una  camarada  del  equipo:  la  doctora  Lidia  Martos  y ella  prometió 
ayudarme  en  los  primeros  pasos:  pero  me  traicionó,  informó  de  esto  al  señor  Zuccarini  y yo  me  enteré. 
Iodo  esto  ocurría  el  19  de  diciembre  ... 

Hice  que  me  extrajeran  sangre  de  la  vena  para  saber  en  qué  condiciones  se  encontraba  mi  organismo,  si 
tenía  defensas  orgánicas,  etc13. 


Dejemos  por  ahora  en  suspenso  este  relato  y prosigamos  con  la  narrativa  general. 

El  1 9 de  diciembre,  en  el  aula  magna  de  la  Facultad  de  Medicina  ( UBA).  se  realiza  un  encuentro  científico, 
oportunidad  en  la  que  se  presenta  todo  lo  que  se  imputa  como  interesante.  Se  visualizan  dos  posiciones: 
las  comisiones  de  la  Facultad  de  Medicina  y del  Instituto  Nacional  de  Microbiología,  sustentaban  con 
firmeza  la  teoría  de  la  naturaleza  viral  de  la  enfermedad;  en  tanto,  otros  investigadores  persistían  en  la  teoría 
de  la  Leptospira.  una  bacteria,  como  agente  etiológico.  No  faltaron  aquellos  que  sostenían  estaba  relacio- 
nada a procesos  tóxicos  determinados  por  las  fumigaciones  en  los  campos  con  (el  insecticida)  dieldrin 
para  combatir  las  tucuras16. 

Ante  tal  decepcionante  situación.  Barrera  Oro  toma  la  decisión  de  auto- inocularse  y redacta  un  informe 
para  la  lectura  de  sus  potenciales  continuadores17,  pues  no  tiene  la  certeza  total  de  los  resultados. 

Nos  detenemos,  una  vez  más.  para  hacernos  dos  preguntas:  por  un  lado  una  de  carácter  metodológico,  ¿era 
el  momento  oportuno  para  llevar  adelante  esta  "inoculación"? 

La  otra  desde  una  perspectiva  ética,  ¿era  correcta  o por  lo  menos  aceptable  tan  personal  y,  posiblemente, 
precipitada  decisión  ? Un  entendido,  tal  vez.  nos  diría  que  lo  guió  el  principio  de  benevolencia:  se  dispuso 
a actuar  en  beneficio  de  otros.  Y.  a la  vez.  el  ideal  de  beneficencia,  que  implica  actos  supererogatorios, 
que  este  caso  particular  fue  asumir  una  actitud  altruista. 

El  acto  de  inoculación  que  se  auto-indicó  Barrera  Oro  merece  algunas  reflexiones.  Antes,  es  preciso  co- 
mentar que  tales  actitudes  frente  a un  problema  científico  son  poco  frecuentes  y forman  parte  de  un  tiempo 
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pasado,  incluso  anterior  a la  época  en  que  actuó  este  investigador.  Ejemplos,  con  algún  grado  de  similitud, 
aparecen  en  Edward  Jenner  (al  inocular  a su  hijo  con  lo  que  luego  sería  la  vacuna  antivariólica)  y en  Daniel 
Alcidez  Carrión  García  (quien  lo  hizo  con  un  extracto  de  verruga  peruana  con  consecuencias  nelastas. 
posteriormente,  se  dispuso  que  la  enfermedad  llevase  su  nombre). 

Tales  conductas,  por  un  lado,  muestran  un  grado  de  decisión  mezclado  con  el  deseo  de  llegar  a la  verdad 
y.  por  otro,  hay  una  cuestión  relacionada  con  los  tiempos  de  espera.  En  electo,  al  presente,  los  modelos 
animales  proveen  de  técnicas  con  las  que  es  posible  identificar  si  un  microbio  es  el  agente  etiológico  ( virus 
por  ejemplo)  de  una  enfermedad  o no.  Asimismo  ocurre  con  drogas,  vacunas  y demás  elementos  que  luego 
van  a ser  usados  en  el  ser  humano.  La  generación  de  modelos  animales  patológicos  y su  validación  insume 
tiempo  que  se  puede  medir  en  meses  o años. 

En  el  caso  de  Barrera  Oro,  es  importante  dejar  en  claro  que  aún  en  el  caso  que  al  inocularse  hubiera  dudas 
sobre  el  rol  del  virus  involucrado,  la  investigación  no  se  iba  a detener  allí.  Por  el  contrario,  la  generación  de 
terapéuticas,  tales  como  una  vacuna,  siempre  iban  a precisar  de  modelos  animales  patológicos. 

Volvamos  al  relato  del  protagonista,  en  primera  persona: 


"De  la  Facultad  salí  totalmente  decidido  a inocularme  y me  vine  al  Instituto.  Lo  primero  que  hice  tue  sacri- 
ficar tres  ratones  enfermos,  les  saqué  el  cerebro,  preparé  una  suspensión  de  I lanks  con  antibiótico  e hice  los 
controles  de  esterilidad  de  la  suspensión,  sembrándolos  en  medio  de  cultivo,  y comencé  el  primer  paso  de 
la  prueba  de  titulación  que  en  el  futuro,  determinaría  la  cantidad  de  virus  que  me  había  inoculado  ... 

Con  vergüenza  declaro  que  no  me  animaba  a darme  yo  mismo  el  pinchazo  ...  llamé  al  sereno  del  Instituto 
1 léctor  Omán,  que  era  estudiante  de  medicina  y con  el  engaño  que  necesitaba  darme  una  vacuna,  le  rogué 
que  me  inyectara  en  el  hombro  derecho,  en  la  región  deltoidea  ... 

Redacté  luego  las  instrucciones  para  mis  compañeros  de  equipo: 

El  objeto  fundamental  de  este  trabajo,  es  tratar  de  demostrar,  definitivamente,  que  el  agente  patógeno  ais- 
lado de  los  enfermos  de  Junín  reproduce  la  enfermedad  en  el  hombre,  después  de  haber  sido  mantenido  ese 
agente  por  pasajes  en  lauchas  lactantes.  Por  lo  tanto,  se  deberá  prestar  especial  atención  a la  ejecución  de  las 
pruebas  tendientes  a demostrar  que  la  enfermedad  provocada  experimentalmente,  es  la  misma  que  afectó  a 
los  pacientes  de  Junín.  Con  este  fin  se  dará  prioridad  a lo  siguiente: 

12-  Inoculación  de  sangre  exclusivamente,  a lauchas  lactantes  (1C-SC-1N-IP),  a cobayos  (IP),  a em- 
brión. 

22-  Cultivos  en  Eugon  broth,  en  medio  con  tioglicato  y en  medio  de  Vervoort  (de  sangre  exclusiva- 
mente). 

3’.-  Recuento  de  glóbulos  blancos. 

42-  Recuento  de  plaquetas. 

52-  Recolección  de  sangre,  sistemáticamente  todos  los  días  después  de  aparecidos  los  síntomas  de  la  en- 
fermedad experimental,  para  pruebas  serológicas. 


Si  se  logra  aislar  supuestos  agentes  patógenos,  se  hará: 

1 2 anímenos  para  fijación  de  complemento  que  se  ensayará  con  el  suero  200  (está  en  la  congeladora  de  la 
heladera  de  la  sección  Peste); 

22  pruebas  de  neutralización  con  los  sueros  167  y 200. 

Si  el  paciente  no  fallece,  con  sus  sueros  del  periodo  de  convalecencia  se  hará: 

12  prueba  de  fijación  de  complemento  frente  a antígeno  preparado  con  cepa  Davio: 

22  prueba  de  neutralización  con  cepa  Davio. 

SE  ADVIERTE  SEVERAMENTE  que  no  debe  cometerse  el  error  de  tratar  de  estudiar  todos  los  aspectos 

de  la  enfermedad  experimental. 

Acordarse  siempre  del  objeto  primordial  del  trabajo. 

PARA  CUMPLIR  EL  OBJETO  DEL  TRABAJO  SE  DEBERAN  OBSERVAR  ESTRICTAMENTE  LAS 
SIGUIENTES  INSTRUCCIONES: 
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1  ) lodos  los  días,  a partir  del  siguiente  a la  inoculación,  se  extraerá  estérilmente  10  mi  de  sangre  venosa 
heparinizada  (aguja  de  platino);  de  esos  diez  centímetros  cúbicos,  uno  estará  destinado  para  lauchas  (in- 
ocular una  camada  por  día):  y cuatro  para  cultivos  (un  matraz  de  Eugon  broth,  cinco  tubos  de  tiogl icolato, 
y cinco  tubo  de  Vervoort  por  día).  La  extracción  de  sangre  heparinizada  se  suspenderá  en  la  mitad  de  la 
convalecencia. 


2 ) lodos  los  días,  a partir  del  comienzo  de  los  síntomas,  se  extraerán  10  mi  de  sangre  y se  conservará  el 
suero  a -20 A para  pruebas  serológicas. 

3 ) Las  pruebas  generales  de  laboratorio  sólo  se  harán  en  5 días  de  la  totalidad  del  experimento:  en  un  día 
del  período  de  comienzo,  en  un  día  del  período  de  estado,  en  un  día  sea  del  premortem.  sea  del  comienzo 
de  la  convalecencia,  en  un  día  de  la  convalecencia. 

RECORDAR  SIEMPRE  El.  OBJETO  PRIMORDIAL  DEL  TRABAJO. 

EVITAR  PERDERSE  EN  LOS  LABERINTOS  DEL  LABORATORIO  CLINICO. 

4 ) Si  se  declara  la  enfermedad,  SE  ORDENA  DEJAR  QUE  SIGA  SU  EVOLUCION  NATURAL.  SE 
PROHIBI  USAR  SUERO  DE  CONVA LESCI ENTES.  SE  PROHIBE  USAR  ANTIBIOTICOS,  (excepto 
en  el  caso  de  que  aparezcan  complicaciones  bacterianas,  diagnosticadas  por  cultivo).  SE  PERMITE  USAR 
CUALQUIER  RECURSO  INESPECIFICO,  QUE  EL  MEDICO  CONSIDERE  NECESARIO. 

(Ruego  a los  que  intervengan  en  este  trabajo,  que  no  se  dejen  influir  por  consideraciones  sentimentales  y 
cumplan  fielmente  el  punto 


Para  completar  tan  interesante  referencia,  agregamos  la  explicación  que,  oportunamente,  ofreciera  el 
odontólogo  Leónidas  Barrera  Oro,  quien  comentó  que,  en  un  primer  momento,  no  tomó  en  serio  las  pal- 
abras de  su  hermano  Julio  Guido.  Pero,  el  21  de  diciembre,  a 48  horas  de  aquel  episodio,  le  observa  en 
la  región  deltoidea  del  brazo  derecho  una  reacción  intensa  en  la  zona  de  inoculación  y,  a partir  de  allí,  se 
concentra  en  la  situación  y así  podrá  relatar: 


"Efectúa  un  preparado  con  800  mg  de  células  de  laucha  lactantes,  inoculadas  con  la  cepa  "Davio"  (en  el 
pasajelj' ).  con  3.5  ce  de  liquido  de  Hanks  más  0.5  de  solución  acuosa  conteniendo  1000  U de  Penicilina  g 
Sódica  y 500  mg  de  Sulfato  de  Estreptomicina. 

El  período  de  incubación  de  la  enfermedad  experimental  fue  breve,  de  39  horas  aproximadamente.  El  23 
de  diciembre  comienza  con  liebre  por  la  tarde;  el  24.  presenta  cara  "vultuosa  y enrojecida":  facies  de  ebrio, 
piel  de  la  cara  como  expuesta  a quemaduras  de  sol,  la  marcha  era  oscilante  como  de  pato,  la  conjuntiva 
inyectada  en  sangre,  fiebre  no  muy  alta,  de  38  aproximadamente,  la  mucosa  de  los  labios  presentaba  un 
color  gris  que  contrastaba  con  el  gran  enrojecimiento  de  las  fauces,  las  encías  presentaban  un  color  rojo 
violáceo  ... 

El  día  25  es  internado  en  el  I lospital  Británico.  Presentaba  gran  agitación,  era  difícil  tenerlo  en  la  cama,  do- 
lores en  las  pantorrillas  y en  la  región  lumbar,  hiperestesias  cutáneas,  casi  no  soportaba  las  sábanas,  temblor 
de  lengua  y epigastralgia  que  lamentablemente  se  fue  agravando  por  la  administración  de  "Corifedrine" 
que  le  administraban  para  aliviar  los  otros  síntomas  ... 

Se  lo  sometió  a un  baño  de  inmersión  caliente,  que  pareció  calmarlo.  Lo  obligaron  a ingerir  líquidos,  ya 
que  rechazaba  todo. 

El  día  26.  comienza  a establecerse  la  oliguria:  el  28  aparecen  las  primeras  epistaxis,  después  la  hemoptisis. 
A esta  altura  tenía  delirios  y convulsiones. 


La  mejoría  comienza  a fines  de  diciembre.  No  puedo  precisar  bien  la  fecha,  para  el  30  ó 31.  Como  en 
muchos  pacientes  comienza  con  una  gran  poliuria,  cesan  al  parecer  los  trastornos  gástricos;  comienza  a 
inferir  alimentos,  pero  esto  es  seguido  de  vómitos,  cesa  la  fiebre:  comienza  a recuperar  la  tensión  arterial 
El  2 de  enero  regresa  a su  domicilio.  La  mirada  resulta  extraña,  hasta  mucho  tiempo  después  pierde  el 
cabello.  Permanece  en  reposo  varios  días  más"  l9. 


Esta  descripción,  realizada  por  el  expreso  pedido  del  paciente  en  cuestión,  coincide  en  rasgos  generales  con 
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la  torma  de  presentación  de  la  enfermedad  en  las 


n^rcnníic  í'lucífimrlíic  romo 


damente  grave. 

Las  pruebas  de  laboratorio,  efectuadas  por  sus  compañeros  del  equipo  del  INM  permitieron  comprobar 
la  existencia  en  sangre  del  virus  en  el  3°,  6\  7",  9 , 10“  y 12  día  desde  la  inoculación  experimental, 
leucopenia  con  aneosinofilia  y plaquetopenia,  130.000  plaquetas  el  9 día,  confirmando  todo  esto  que  el 
germen  aislado  era  el  causante  de  la  enfermedad  y que  por  sus  características  de  comportamiento,  era  viral 
(desechando  la  teoría  de  la  Leptospira  y de  los  agentes  tóxicos). 


”A  la  semana  de  la  autoinoculación,  aproximadamente  -continuamos  leyendo-,  un  joven  colega  y dis- 
cípulo de  Julio  Guido,  el  Dr  Martíni,  no  recuerdo  el  nombre20,  realizó  una  autoinoculación  similar,  quería 
seguir  junto  a su  colega  pero  fue  terrible  ... 

Comenzó  rápidamente  con  una  enfermedad  extremadamente  grave  que  lo  llevó  a una  coagulación  intravas- 
cular  diseminada  y falleció  a las  48/72  horas  ... 

Nunca  supimos  bien  si  el  inoculo  fue  superior  al  de  Julio  Guido  o la  respuesta  del  organismo  fue  diferente, 
fue  terrible,  se  perdió  un  gran  investigador  ...”21. 


Después  de  1959 

Barrera  Oro  hizo  su  recuperación;  mientras  Pirosky,  en  los  laboratorios  del  INM.  procedía  a aislar  el  virus. 
A la  par,  en  la  cátedra  de  Microbiología,  de  la  FM/UBA,  el  investigador  Armando  S Parodi  22  y su  equipo 
hacían  lo  propio  y preparaba  una  vacuna  que  se  empleó  durante  un  tiempo.  No  fueron  los  únicos  ya  que 
unos  cuantos  más  también  estaban  concentrados  en  la  dolencia.  Las  motivaciones  eran  múltiples,  donde 
no  faltaban  las  económicas  y políticas,  ya  sea  porque  afectaba  a una  zona  de  alta  producción  cerealera  y ga- 
nadera, con  demanda  de  mano  de  obra  estacional  y permanente,  con  commodities  de  altos  rindes;  ya  sea  de 
razones  políticas,  pues  el  gobierno  democrático  de  la  época  estaba  muy  amenazado  por  fuerzas  dispuestas  a 
su  clausura  y buscaba  pretextos  para  lograr  su  intento,  justificándolo  en  razones  de  inoperancia. 

Nacía  el  Conicet  y.  algo  más  tarde,  la  carrera  de  investigador  científico. 


1962 

Una  nueva  interrupción  democrática  y las  Fuerzas  Armadas  ubican  en  el  Poder  Ejecutivo  Nacional,  según 
la  ley  de  acefalía.  al  presidente  provisional  del  Senado;  José  M Guido,  quien  tendrá  como  asesor  en  el 
Ministerio  de  Salud  a Tiburcio  Padilla.  El  Instituto  que  conducía  Pirosky  fue  intervenido  y comienzan 
años  de  incertidumbre,  mientras  decae  el  interés  (científico/político)  por  la  enfermedad,  no  por  cuenta  de 
los  posibles  afectados  y la  población  lugareña  en  su  conjunto.  Parte  de  los  pesquisadores  allí  reclutados 
abandona  el  país  o la  investigación. 


1964 

Para  entonces  ya  se  sabía  que  la  dolencia  tenía  relaciones  con  afecciones  similares  aparecidas  en  la  India. 
China.  Bolivia.  Rusia  y se  llevaron  a delante  prolijas  compulsas,  más  serios  cuidados  asistenciales  y pre- 
ventivos. Mientras  el  Congreso  de  la  Nación  aprueba  la  creación  de  la  Comisión  Nacional  Coordinadora 
de  Estudio  v Lucha  contra  la  FHA27. 


1965 

Se  instala  en  Pergamino  un  nuevo  grupo  de  estudio,  que  suma  esfuerzos  a los  del  INM;  entre  ellos  Julio 
Maiztegui24,  quien  está  acompañado  por  miembros  el  Centro  de  Educación  Médica  e Investigaciones  Clíni- 
cas (CEMIC).  quien  dispuso  de  admiradores  y detractores  (como  suele  ser  común  en  estas  situaciones),  con 
opiniones  de  idóneos  y legos,  de  interesados  y desinteresados. 

1966 

Llesa  el  golpe  militar  del  28  de  junio,  encabezado  por  Juan  C.  Onganía.  quien  desalojó  al  presidente  Arturo 
íllia  y abortó,  entre  muchos  otros,  los  esfuerzos  que  hacía  este  grupo  humano  arriba  mencionado. 
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Ante  la  grase  situación,  que  sumó  a cuestiones  personales,  Julio  G Barrera  Oro  parte  a EEUU,  donde 
continua  con  sus  investigaciones. 

1971-1975 

Maiztegui  comenzó  a tratar  a los  infectados  recientemente  con  sueros  de  pacientes  recuperados  y redujo, 
de  manera  notable,  la  mortalidad  (se  calcula  que  al  1 0 o).  Hubo  ensayos,  vacunaciones,  críticas,  auspicios, 
avances,  retrocesos25. 

1976  (y  siguientes) 

bn  marzo  la  sexta  interrupción  jurídico-política  del  siglo  XX  que  afectó  al  país.  Ahora  la  conducción  es  re- 
sponsabilidad de  una  Junta  Militar  que  interviene  todos  los  poderes  y hace  todo  tipo  de  re-designaciones. 
Llega  1978  y nace  el  instituto  Nacional  de  Estudios  sobre  Virosis  Hemorrágieas,  en  Pergamino  (hoy: 
Instituto  Nacional  de  Enfermedades  Virales  Humanas  Julio  Maiztegui  . 1NEVH)  para  continuar  con  los 
estudios. 

Por  un  convenio  entre  el  1NEVH,  la  OPS  y un  programa  de  la  ONU.  Barrera  Oro  fue  comisionado  para 
buscar  una  vacuna  a \ ¡rus  vivos  atenuados  y viajó,  otra  vez.  a EEUU.  En  ese  tiempo  trabaja  en  Fort  Detrick 
(Maryland),  en  una  instalación  que  pertenece  al  Comando  Médico  del  Ejército  de  los  EEUU:  el  Instituto  de 
Investigación  Médica  sobre  Enfermedades  Infecciosas  (Usamriid). 

1981-1 989 

Barrera  Oro  aísla  la  cepa  Candid  U'’  y el  resultado  fue  la  vacuna,  altamente  inmunológica,  que  fue  cedida 
al  INEVH. 

Los  ensayos  clínicos  de  fases  l.  II  y 111.  realizados  entre  1985  y 1989.  demostraban  que  la  vacuna  es  segura 
y su  eficacia  en  hombres  de  15  a 65  años  es  del  95.5%.  Además,  se  ha  constatado,  mediante  anticuerpos 
neutralizantes,  que  la  respuesta  inmunitaria  específica  se  mantiene  hasta  13  años  después  de  la  vacunación 
en  más  de  90%  de  los  vacunados  27.  Sin  embargo,  no  hay  interés  comercial  en  su  producción  debido  a que 
es  considerada  una  vacuna  "huérfana”,  sólo  sirve  para  aplicar  a número  reducido  de  personas  de  una  región 
de  la  Argentina28. 

Los  diarios  mantenían  informada  a la  población.  En  una  nota  titulada:  Etapa  tlnal  de  la  vacuna  elaborada 
por  un  científico  argentino,  leemos,  casi  al  término  del  relato: 


"Barrera  Oro  adelantó  que  el  año  próximo  en  un  congreso  a celebrarse  en  Mar  del  Plata,  con  la  presencia 
de  virologos  de  jerarquía  internacional,  se  darán  a conocer  oficialmente  los  resultados  obtenidos  mediante 
la  vacunación  humana"  . 


1990  y siguientes 

Se  estuvo  en  condiciones  de  decir  que  la  Candid  1 era  efectiva.  Los  investigadores  y múltiples  colabora- 
dores habían  actuado  en  momentos  de  dictadura  y democracia;  por  suerte,  ahora  parecía  que  se  entraba  de 
manera  definitiva  por  esta  senda. 

Lina  vez  más.  varias  notas  en  los  diarios.  Veamos  algunos  titulares:  Vacuna  para  el  Mal  de  los  Rastrojos. 
Lo  anunció  Julio  Maiztegui.  Comprueban  la  elevada  eficacia  de  una  vacuna  contra  la  fiebre  hemorrágica30. 
Otro:  Pergamino  neutralizó  la  fiebre  hemorrágica;  en  este  aparece  el  siguiente  resumen: 


"la  licenciada  María  Rosa  Feuillade,  a cargo  del  Instituto  de  Virosis  Hemorrágica,  explicó  importantes 
detalles  del  descubrimiento. 

La  investigación  a cargo  de  los  doctores  Julio  Maiztegui  y Julio  Barrera  Oro.  empezó  a Unes  de  1979  (sie) 


La  vacuna,  que  no  tiene  efectos  colaterales  y genera  anticuerpos,  tendría  costos  de  producción  muy  altos, 
aún  difíciles  de  estimar ... 

...  esta  ciudad  está  construyendo  su  propio  laboratorio  de  alta  seguridad,  pero  para  que  sea  terminado  se 
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necesitan  los  fondos  prometidos  por  el  Ministerio  de  Salud  y Acción  Social”  1 . 

El  reporte  (de  divulgación,  no  de  carácter  científico)  como  se  puede  ver.  tiene  algunas  licencias. 

Muy  valiosas  resultan  las  palabras  de  Maiztegui,  quien  dijo,  en  1993,  al  recibir  un  premio: 

"Me  veo  obligado  a compartir ...  la  historia  del  mal  de  rastrojos  que  comienza  en  la  República  Argentina 
allá  por  1955,  y no  son  otros  que  Armando  Parodi  de  la  cátedra  de  Epidemiología  y Julio  Barrera  Oro.  el 
creador  de  la  vacuna  Gandid  I”32. 


Años  más  tarde,  aparecía  una  nota  inquietante:  Queda  poca  vacuna  par  la  fiebre  hemorrágica,  que  continu- 
aba así: 


"Problema:  se  trata  de  un  producto  elaborado  en  los  Estados  Unidos  por  cuya  continuidad  se  teme;  se  ex- 
perimentó con  éxito  una  fórmula  local,  pero  faltan  fondos  para  fabricarla. 

...  según  dijo  ladirectora,  Delia  Enría  y la  investigadora  Ana  Ambrosio,  los  habitantes  de  la  zona  endémica 
quedarían  expuestos  al  contagio,  hoy  prevenido  por  200  mil  dosis  producidas  en  los  Estados  Unidos  y en 
vías  de  agotarse  debido  a la  campaña  de  vacunación  que  se  extiende  ... 

En  tanto,  y como  parte  de  un  convenio  internacional,  el  virólogo  argentino  Julio  Barrera  Oro  viajó  a los 
Estados  Unidos  donde  desarrolló  una  semilla  de  vacuna,  al  tiempo  que  en  Pergamino  se  inició  la  construc- 
ción de  un  edificio  que  cumpliera  con  las  normas  de  seguridad  biológica  ... 

Como  la  enfermedad  es  exclusiva  de  nuestro  país  y en  el  extranjero  no  se  prevé  seguir  produciendo  el  antí- 
doto. cuando  se  agoten  las  dosis  existentes  habrá  3.500.000  personas  expuestas  a contraer  el  mal  ...'  J. 

Valoramos  el  esfuerzo  del  periodismo.  De  esa  manera  se  tiene  la  atención  del  público  y,  tundamentalmente. 
de  las  autoridades  que.  ante  la  presión  ciudadana,  encuentran  la  manera  de  sortear  los  obstáculos. 


2000-2010 

La  ANMAT  (Administración  Nacional  de  Medicamentos,  Alimentos  y Tecnología  Médica,  creada  en  1992. 
como  dependencia  del  Ministerio  de  Salud  y Acción  Social),  habilitó  la  planta,  en  Pergamino,  para  la  pro- 
ducción de  la  vacuna’4.  Leemos: 

"Existe  un  plan  de  vacunación,  con  miras  a una  gran  reducción  de  casos  y la  vacuna  ha  demostrado  también 
ser  efectiva  contra  el  virus  Machupo  y,  por  ende,  considerada  como  tratamiento  alternativo  para  la  fiebre 
hemorrágica  boliviana0. 


El  resto  puede  completarse  con  la  lectura  del  Anexo. 


EL  INSTITUTO  NACIONAL  DE  MICROBIOLOGÍA  (y  sus  sucesivos  cambios) 

Tal  vez  resulte  innecesario  hacer  mención  a éste,  pues  se  ha  escrito  mucho  y bien.  Aún  así.  para  algún  lector 
menos  informado,  incluiremos  algunas  referencias. 

Existió,  desde  los  finales  de  la  década  de  1880.  un  Instituto  Bacteriológico  Nacional  (como  dependencia 
del  Departamento  Nacional  de  Higiene  -DNH-)  que  contó  con  el  apoyo  de  Carlos  Malbrán  y.  poco  después, 
de  José  Penna.  profesional  que  impulsó  la  venida  al  país,  hacia  1916.  del  importante  bacteriólogo  Rudolf 
Kraus  (su  director  entre  1913  y 1921 ).  Con  él  colaboraron  o se  formaron  algunos  de  los  más  sobresalientes 
investigadores  argentinos,  al  modo  de  Alfredo  Sordelli  y Bernardo  A Houssay  o Salvador  Mazza  > Ángel 
Roffo  y fue  un  punto  de  arranque  de  nuestra  tradición  biomédica. 


Con  la  llegada  del  peronismo,  ese  DNH  se  transformó  en  un  ministerio  y hubo  modificaciones  en  su  or- 
ganigrama; en  el  primer  postperonismo,  el  propio  instituto  fue  remozado  y aparece  el  primer  laboratorio 
de  biología  molecular,  enmarcado  en  un  proceso  más  amplio  de  "modernización"  en  ciencia  y tecnolog  ía, 
con  la  dirección  de  Ignacio  Pirosky.  En  efecto,  en  1956.  asumió  como  director  (por  decisión  del  ministro  de 
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Asistencia  Social  \ Salud  Pública.  Francisco  Martínez,  en  época  de  la  Revolución  Libertadora).  El  viejo  In- 
stituto Bacteriológico  se  transformó  en  Instituto  Nacional  de  Microbiología  "Carlos  Malbrán"30.  Un  tiempo 
pasó  hasta  que  Héctor  V Noblía  (ministro  de  Arturo  Frondizi)  ante  un  proceso  infeccioso  que  afectaba  a 
una  zona  de  Buenos  Aires  (que  es  el  leit  motiv  de  este  trabajo),  decide  instalar  en  Junin  (junio  de  1 958  a 
setiembre  de  1 959)  una  Comisión  Nacional  ad  hoc  (que  integran  especialistas  como  el  citado  Pirosky,  Juan 
A Zuccarini.  Ernesto  Molinelli,  Arturo  Di  Pietro,  Pedro  Martini,  Julio  Barrera  Oro  y la  asistencia  técnica 
de  Luis  F Frugoni  Gutman.  Manuel  A De  León  y personal  auxiliar,  más  Lidia  Marios,  Matiel  de  d'Ampaire 
y Alberto  F Pfeifer). 

A Barrera  Oro,  Martini  y Frugoni  Gutman  (y  el  propio  Pirosky),  se  les  asignó: 


' lodo  lo  relativo  a experiencias  en  animales  de  laboratorio,  en  particular  en  ratones,  previo  análisis  y for- 
mulación del  protocolo  experimental”37. 

Seguimos  leyendo: 

"Primera  inoculación  experimental  en  el  hombre.  Para  cumplir  también  en  esta  infectopatía  los  clásicos 
postulados  de  la  microbiología,  uno  de  los  autores  (J  G Barrera  Oro),  por  propia  decisión,  resolvió  practi- 
car en  si  mismo  la  primera  reproducción  experimental  de  la  enfermedad,  inoculándose  el  agente  patógeno 
aislado  ... 

Conclusiones.  Sobre  la  base  del  estudio  anatomoclínieo,  de  los  datos  epidemiológicos  y de  las  investigacio- 
nes etiológicas.  puede  afirmarse:  ... 

5)  La  inoculación  experimental  al  hombre  ha  permitido  reproducir  típicamente  los  cuadros  clínico,  hema- 
tológico  y urinario  de  la  enfermedad  natural  habiéndose  recuperado  el  agente  etiológieo  específico  de  la 
sangre  circulante  del  voluntario. 

6)  De  ácaros  hematófagos,  del  suborden  de  los  Mesostigmata,  capturados  en  las  áreas  endemoepidémicas. 
se  ha  recuperado  el  virus  causar38. 

Este  período  de  Piroskv  (abril  de  1956  a abril  de  1962).  con  la  conformación  de  dos  nuevas  secciones 
dentro  del  Instituto,  de  genética  bacteriana  y de  biología  molecular,  concluv e cuando  es  intervenido  por  el 
Ministerio  de  Salud  Pública3'',  tras  la  destitución  del  titular  del  l’oder  Ejecutivo  Nacional.  I lubo  un  período 
perdido  que  llega  hasta  la  década  de  19704<l. 


BREVE  DATOS  SOBRE  BARRERA  ORO 

Julio  G fue  incorporado  al  Instituto  Malbrán  en  los  concursos  de  1957.  con  28  años,  donde  permaneció 
hasta  su  retiro  a EEUU.  En  este  país  realizó  estudios  posdoctorales  en  la  Escuela  de  Medicina  de  la  Baylor 
Un  i v ers  i ty  ( H o us  ton/T  ex  as ). 

Durante  su  etapa  de  trabajo  en  Marvland,  en  el  Instituto  de  Investigación  Médica  sobre  Enfermedades  In- 
fecciosas (Usamriid)  desarrolló  la  vacuna  Gandid  1. 

En  este  logro  hay  unas  cuantas  figuras  cardinales:  Barrera  Oro.  Pirosky,  Parodi,  Maiztegui  y muchos 
silenciosos  colaboradores,  que  deben  ser  más  de  un  centenar41. 

Recomendamos  leer  los  fundamentos  del  Proyecto  de  Resolución  de  la  H.  Cámara  de  Diputados  de  la 
Nación  (incluido  en  el  anexo)  que  resultan  muy  esclarecedores. 


CONCLUSIONES 


La  FUA  es  una  enfermedad  viral,  de  características  regionales,  muy  grave  ya  que  puede  llevar  a la  muerte. 
Fue  Julio  Guido  Barrera  Oro  una  pieza  clave  en  la  búsqueda  de  la  solución,  con  resultados  benéficos  para 
muchos  pobladores  de  una  determinada  región  de  la  Argentina. 

Se  entrecruzan  acá  (y.  no  es  una  novedad,  pues  por  lo  general  se  puede  hacer  extensible  a una  multiplicidad 
de  investigaciones)  cuestiones  humanas,  sociales,  económicas,  políticas,  antropológicas,  etc. 

No  olvidemos  las  problemáticas  del  "poder"  y,  en  este  sentido  analícese  que  fue  el  Ejército  de  EEUU  quien 
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"prestó'  su  concurso  para  la  investigación. 

ANEXO 


H.  Cámara  de  Diputados  de  la  Nación 
PROYECTO  DE  RESOLUCIÓN 


Texto  facilitado  por  los  firmantes  del  proyecto.  Debe  tenerse  en  cuenta  que  solamente  podrá  ser  tenido  por 
auténtico  el  texto  publicado  en  el  respectivo  Trámite  Parlamentario,  editado  por  la  Imprenta  del  Congreso 
de  la  Nación. 


N°  de  Expediente 

Tr  á m i te  Parlamentario 

Sumario 

Firm  antes 
Ciro  a Comisiones 


0105-D-2007 
002  (02/03/2007) 

EXPRESION  DE  BENEPLACITO  POR  LA  PRODUCCION  DE  LA  PRIMERA 
VACUNA  ARGENTINA  CONTRA  LA  FIEBRE  HEMORRAGICA  "GANDID  1 
INGRAM,  RODDY  ERNESTO  - WEST.  MARIANO  FEDERICO. 
ACCION  SOCIAL  Y SALUD  PÚBLICA 


La  Cámara  de  Diputados  de  la  Nación 
RESUELVE 


Expresar  su  especial  beneplácito  por  la  producción  de  la  primera  vacuna  argentina  contra  la  liebre  hemor- 
rágica  -una  zoonosis  que  puede  ser  mortal  si  no  es  tratada  a tiempo  y cuya  población  en  riesgo  se  estima  en 
5 millones  de  personas-  que  se  conocerá  como  “Candid  1"  y será  desarrollada  en  el  Instituto  Nacional  de 
Enfermedades  Virales  Humanas  "Julio  Maiztegui”,  de  Pergamino. 

FUNDAMENTOS 


Señor  presidente: 

La  vacuna  contra  la  fiebre  hemorrágica,  una  zoonosis  que  puede  ser  mortal  si  no  es  tratada  a tiempo  y cuya 
población  en  riesgo  se  estima  en  5 millones  de  personas,  se  producirá  en  el  país  a partir  de  un  convenio 
firmado  en  la  Casa  Rosada. 


El  presidente  Néstor  Kirchner  y el  ministro  de  Salud,  Ginés  González  García,  anunciaron  en  Casa  de 
Gobierno  la  fabricación  nacional  de  la  primera  vacuna  contra  la  fiebre  hemorrágica  argentina  (FUA).  La 
producción  local  de  la  droga,  que  se  conocerá  como  "Gandid  l '\  se  llevará  a cabo  en  el  Instituto  Nacional 
de  Enfermedades  Virales  Humanas  'Julio  Maiztegui'  (INEVH),  dependiente  del  Instituto  Malbrán. 


El  "Maiztegui'’  es  el  primer  laboratorio  en  la  Argentina  habilitado  para  la  producción  de  vacunas  virales 
humanas  con  certificación  del  cumplimiento  de  las  normas  internacionales  de  "Buenas  Prácticas  de  Manu- 
factura". 


La  Fiebre  Hemorrágica  es  una  enfermedad  viral  aguda  grave,  caracterizada  por  un  síndrome  febril  con 
alteraciones  hematológicas.  neurológicas.  renales  y cardiovasculares,  que  puede  producir  la  muerte  si  no 
es  atendida. 

El  área  endémica  de  la  fiebre  cubre  aproximadamente  unos  150  mil  kilómetros  cuadrados  en  las  provincias 
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de  Buenos  Aires,  Córdoba,  Santa  Fe  y La  Pampa,  con  una  población  de  riesgo  estimada  en  5 millones  de 
habitantes. 

Los  primeros  casos  de  Fiebre  Hemorrágica  en  el  país  se  conocieron  a principios  de  la  década  de  1 950  y para 
1958,  se  identificó  su  agente  etiológico  al  que  se  denominó  "virus  Junin".  La  enfermedad  es  una  "zoonosis 
con  reservorio  animal”:  se  incuba  en  el  roedor  "Calomys  musculinus”  y se  transmite  a los  humanos  por 
contacto. 


Actualmente,  los  pacientes  disponen  de  un  tratamiento  específico  denominado  "plasma  de  convalecientes 
de  la  F1 IA”,  cuya  administración  precoz  es  eficaz  y disminuye  la  mortalidad  al  1%. 


Hace  16  años  que  se  utiliza  una  vacuna  contra  la  Fiebre  Hemorrágica  de  fabricación  extranjera,  eficaz  en 
un  95.5%  de  los  casos;  la  producción  nacional  de  la  droga  es  un  proyecto  tecnológicamente  único  en  su 
tipo  en  la  Argentina. 

La  metodología  conducente  a la  producción,  control  y aseguramiento  de  calidad  de  una  vacuna  viva  atenu- 
ada para  uso  humano,  según  normas  internacionales  de  BPM,  no  ha  sido  abordada  hasta  la  fecha  por  nin- 
guna otra  institución  pública  o privada  en  la  Argentina. 

Por  "las  dificultades  para  la  producción  de  ciertas  vacunas  en  el  ámbito  internacional,  con  desaparición 
de  laboratorios  productores  comerciales  debido  a cuestiones  de  costo-beneficio'",  el  Ministerio  de  Salud 
"adoptó  una  política  de  costo-efectividad  priorizando  valor  a la  vida  humana". 

Así,  el  impacto  del  proyecto  dentro  del  Programa  Nacional  de  Lucha  contra  la  Fiebre  1 lemorrágiea  Argen- 
tina es  sustancial,  ya  que  permitirá  abordar  definitivamente  el  control  de  esta  endemia  y abriría  la  posibili- 
dad de  que  la  capacidad  generada  para  su  producción  se  pueda  utilizar  para  el  desarrollo  de  otras  vacunas 
similares,  según  las  necesidades  del  país. 

Adema,  la  vacuna  producida  en  la  Argentina  posicionará  a nuestro  país  como  productor  de  vacunas  virales 
creadas  completamente  en  el  país. 


La  vacuna  fue  producida  por  primera  vez  en  listados  Unidos.  Entre  1985  y 1988  se  inocularon  más  de  300 
voluntarios  humanos  entre  los  que  no  se  observaron  efectos  secundarios  severos  atribuibles  a su  aplicación. 
Asimismo  en  más  del  90%  de  los  voluntarios  se  detectaron  anticuerpos  contra  el  virus  Junín.  Ahora  es 
necesario  demostrar  que  la  vacuna  de  producción  local  tiene  exactamente  la  misma  cantidad  de  anticuerpos 
a la  producida  en  EEUU. 

De  ser  así.  la  Gandid  I.  versión  argentina,  será  utilizada  oficialmente  en  las  próximas  campañas  de  va- 
cunación masiva  para  prevenir  la  enfermedad.  Así  se  estaría  ampliando  la  aplicación  de  la  misma,  lo  que 
revertiría  la  condición  de  "excluidos”  en  la  que  estaban  gran  cantidad  de  mujeres,  niños  y familiares  de 
trabajadores  agrícolas  como  así  también  gente  que  no  está  directamente  vinculada  a la  actividad  rural. 

Se  estima  que  el  estudio  comenzará  a realizarse  a comienzos  de  2005.  una  vez  que  haya  sido  reclutada  la 
cantidad  necesaria  de  personas.  De  un  total  de  950  voluntarios,  estos  serán  divididos  en  dos  grupos,  uno 
de  ellos  recibirá  la  vacuna  fabricada  en  Estados  Unidos  y el  otro  grupo,  la  fabricada  en  el  1NEVFI.  Ni  los 
voluntarios  ni  los  investigadores  conocerán  lo  que  han  recibido  las  diferentes  personas  hasta  ios  seis  meses 
posteriores  a la  inmunización.  El  estudio  se  realizará  ante  los  veedores  de  la  comisión  de  Bioética  de  la 
provincia  de  Córdoba  y los  voluntarios  deberán  firmar  un  acuerdo  de  consentimiento  y concurrir  al  Instituto 
Maiztegui  (Pergamino)  donde  se  realizarán  las  pruebas  y los  estudios  de  rigor.  Iras  los  seis  meses,  se  pro- 
cederá a develar  las  identidades  y el  tipo  de  inoculación  recibida  por  cada  uno  y se  estudiarán  los  resultados 
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con  el  objetivo  de  obtener  el  mayor  grado  de  aproximación  y exactitud  en  cuanto  a 
en  una  y otra  vacuna. 


los  anticuerpos  presentes 


La  enfermedad  se  da  sólo  en  la  Argentina  y que  afecta  aproximadamente  a 5 millones  de  personas  en  la 
zona  endémica,  es  decir,  aquella  en  la  que  se  han  registrado  casos  está  compuesta  por  el  sur  de  la  provincia 
de  Santa  Fe,  Córdoba,  norte  de  Buenos  Aires  y La  Pampa.  Las  investigaciones  en  las  que  participaron  6500 
voluntarios  en  el  sur  de  Santa  Fe  entre  1988  y 1990  permitieron  comprobar  que  la  Gandid  I protege  al  sei 
humano  contra  la  enfermedad  con  una  eficacia  del  95.5%. 


Ln  base  a estos  estudios,  entre  199 1 y 2000  se  procedió  a vacunar  a 227.994  pobladores  de  diferentes  locali- 
dades de  la  provincia  de  Santa  Fe,  Córdoba  y Buenos  Aires.  La  efectividad  de  la  vacuna  bajo  este  protocolo 
es  del  98%.  sin  embargo  se  ha  registrado  una  extensión  del  área  endémica,  lo  que  aumenta  la  cantidad  de 
población  en  riesgo  a 5 millones  de  personas. 


También  se  la  conoce  como  el  mal  de  los  rastrojos,  es  causada  por  el  virus  Junín  y no  es  erradicable  ya  que 
su  reservorio  son  los  ratones.  La  prevención  puede  hacerse  mediante  la  administración  de  plasma  inmune, 
es  decir,  plasma  proveniente  de  personas  que  tuvieron  Fiebre  Hemorrágica  Argentina  y se  recuperaron.  Este 


plasma  contiene  sustancias  llamadas  anticuerpos,  los  cuales  son  capaces  de  actuar  contra  el  virus  Junín.  Los 
más  vulnerables  son  las  personas  que  viven  en  el  campo  y en  caso  de  no  ser  atendidas  adecuadamente,  la 
patología  puede  provocar  un  30%  de  mortalidad. 


En  1971  el  Dr  Julio  Maiztegui  investigó  la  Fiebre  Hemorrágica  y demostró  que  la  mortalidad  del  30%  que 
presentaba  la  enfermedad  se  reducía  al  3%  si  los  pacientes  eran  tratados  con  plasma  de  personas  ya  enfer- 
mas antes  del  8°  día  de  haber  contraído  el  mal. 


Si  bien  la  aplicación  sistemática  de  plasma  se  inició  en  1986.  Maiztegui  se  desveló  para  conseguir  una 
vacuna  efectiva.  Los  esfuerzos  continuos  a pesar  de  la  falta  de  recursos  permitieron  desarrollar  la  etapa 
experimental  de  la  vacuna  cuya  viabilidad  fue  probada  en  voluntarios  en  la  Ciudad  de  Santa  Fe. 

La  vacuna  Candid  1 está  categorizada  internacionalmente  como  “droga  huérfana",  es  decir  un  producto  im- 
prescindible para  una  población  restringida,  cuyo  nivel  de  demanda  no  la  hace  comercialmente  interesante. 
Esto  significa  que  a los  laboratorios  no  les  conviene  producir  una  vacuna  que  solo  será  utilizada  por  un  sec- 
tor del  país.  Por  eso  las  inmunizaciones  serán  financiadas  por  el  Estado  v serán  gratuitas  para  el  público. 
Hoy  es  un  logro  para  el  INEVfl  haber  transitado  todas  las  etapas  necesarias  para  la  creación  de  la  vacuna  y 
que  implica  cumplir  con  los  requisitos  de  bioseguridad. 

Finalmente  el  sueño  de  producir  en  forma  local  la  dosis  contra  la  FHA  del  Dr  Maiztegui.  quien  comenzó  sus 
investigaciones  allá  por  el  año  1950  y demostró  la  viabilidad  de  la  vacuna  Candid  1 que  luego  se  produjo 
en  Estados  Unidos,  está  más  cerca  de  convertirse  en  una  realidad. 


Consideramos  oportuno  reconocer  esta  decisión  de  contribuir  al  mejoramiento  de  la  salud  humana,  al  avance 
científico  y tecnológico  y a la  formación  de  recursos  humanos  por  medio  del  desarrollo  de  medicamentos. 
La  mejora  en  la  salud  de  la  población  que  trae  aparejada  la  producción  de  una  vacuna  como  la  mencionada, 
junto  a los  estudios  fármaco-epidemiológicos  que  a este  respecto  se  realizan,  obra  en  servicio  de  la  toma  de 
decisiones  que  planteen  soluciones  posibles  a las  enfermedades  argentinas  de  difícil  control. 


Por  los  fundamentos  expuestos  solicito  a mis  pares  la  aprobación  del  presente  proyecto  de  resolución. 
Instituto  Superior  de  Enfermedades  Virales  “Dr  Julio  1 Maiztegui" 

Monteagudo  2510-2700 

Pergamino,  tel:  02477-  429712/13/14.  Fax:  02477-433045 
E-mail:  Inevh@satlink.com  o vacunafha@yahoo 
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Firmantes  ARGUMEDO,  ALORA  SUSANA  - DON  DA  PEREZ,  VICTORIA  ANAL1 A 

CARDELLI.  JORGE  JUSTO  - LOZANO,  CLAUDIO  - ITURRASPE,  NORA 
GRACIELA  - MERCHAN.  PAULA  CECILIA  - BENAS.  VERONICA 
CLAUDIA  - VIALE,  L1SANDRO  ALFREDO  - SOLANAS,  FERNANDO 
EZEQUIEL  - MACALUSE,  EDUARDO  GABRIEL  - LINARES.  MARIA  VIRGINIA. 
Giro  a Comisiones  ACCION  SOCIAL  Y SALUD  PUBLICA. 


La  Cámara  de  Diputados  de  la  Nación 


RESUELVE 

Solicitar  al  Poder  Ejecutivo  que  a través  del  organismo  que  corresponda,  informe  sobre  los  siguientes 
puntos: 

I De  las  vacunas  incluidas  en  el  calendario  del  Plan  Nacional  de  Vacunación  que  se  aplican  en  nuestro  país, 
cuáles  de  ellas  son  de  producción  nacional  y cuales  son  importadas. 

2.  Cuál  es  el  monto  de  la  erogación  destinada  a la  importación  de  vacunas  en  los  últimos  cinco  años. 

3.  Con  que  técnicas  se  producen  las  vacunas  importadas. 

4.  Cuáles  son  las  estrategias  existentes  respecto  a la  provisión  y distribución  de  vacunas,  tanto  las  incluidas 
en  el  Programa  Nacional  de  Vacunación,  como  así  también  sobre  las  que  no  están  incluidas  en  el  mismo. 

5.  Dado  el  cambio  a nivel  mundial  del  mercado  de  vacunas,  informe  si  se  está  planteando  alguna  alternativa 
de  producción  local. 

6.  Qué  tipo  de  vacunas  están  en  proceso  de  investigación  y desarrollo  en  los  laboratorios  de  producción 
pública  estatal  y cual  es  el  presupuesto  previsto  para  impulsar  este  desarrollo. 


7.  Qué  tipo  de  vacunas  se  están  produciendo  a nivel  nacional  en  laboratorios  de  producción  pública  estatal 
y que  cobertura  poblacional  brindan. 


FUNDAMENTOS 


Señor  presidente: 

La  producción  de  vacunas  forma  parte  de  la  industria  farmacéutica  con  particularidades  propias,  lo  que  se 
explica  teniendo  en  cuenta  que  en  el  año  2002,  solamente  el  1.5%  del  consumo  mundial  de  medicamentos 
correspondió  a vacunas. 

La  necesidad  de  controlar  epidemias  de  enfermedades  infecciosas  que  castigaron  distintos  puntos  del  pla- 
neta durante  el  siglo  XX,  muchas  veces  vinculadas  a grandes  masas  de  poblaciones  pobres,  dio  un  gran 
impulso  a la  producción  y difusión  de  vacunas.  Existió  una  demanda  para  este  producto  que  si  bien  exigía 
calidad,  también  requería  grandes  magnitudes  y precios  bajos.  De  este  modo  se  desarrollaron  las  técnicas 
hoy  denominadas  tradicionales  y que  en  la  actualidad  son  muy  difundidas.  En  este  período  la  producción  de 
vacunas  en  general  estuvo  enmarcada  dentro  de  las  llamadas  políticas  públicas  de  salud. 


La  dinámica  del  mercado  de  vacunas  fue  estable  hasta  tiñes  de  la  década  del  70  del  siglo  pasado;  desde 
esta  época  la  producción  de  vacunas,  de  modo  similar  a la  industria  farmacéutica,  ha  sido  atravesada  por 
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un  cambio  de  paradigma  tecnológico  que  la  modifica  profundamente,  en  tanto  el  advenimiento  en  esos 
años  de  la  biología  molecular  como  disciplina  emergente  junto  con  las  técnicas  de  ingeniería  genética,  son 
determinantes  de  su  estado  actual. 

Esta  industria  ha  tenido  un  crecimiento  sin  precedentes  en  la  primer  década  del  nuevo  siglo,  la  investig- 
ación y desarrollo  de  las  grandes  empresas  farmacéuticas  ha  sido  la  responsable  principal  de  materializar  el 
conocimiento  en  productos  concretos  y como  consecuencia  de  la  expansión  de  este  mercado.  (Organización 
Mundial  de  la  Salud,  2009). 

En  la  actualidad  existe  una  gama  de  técnicas  con  las  que  se  producen  vacunas,  que  responden  a distintos 
momentos  del  desarrollo  tecnológico 

a)  Técnicas  clásicas  o vacunas  tradicionales: 


Vacunas  atenuadas  vivas 


2.  Vacunas  inactivadas 

3.  Toxoides 

b)  Técnicas  de  avanzada 

El  avance  tecnológico  aplicado  en  esta  industria  permite  superar  una  serie  de  limitaciones  técnicas  del  mod- 
elo tradicional.  Recientemente,  con  la  tecnología  de  ADN  recombinante  se  trabaja  en  una  nueva  generación 
de  vacunas  que  supera  a las  anteriores.  Estos  avances  permiten  a los  investigadores  contemplar  nuevas  es- 
trategias en  el  desarrollo  de  vacunas  logrando  menores  costos  y mayor  seguridad  (hepatitis  B)  o reconstruir 
una  nueva  partícula  viral  segura  (HPV). 

La  participación  de  organismos  internacionales  ha  tenido  gran  relevancia  en  la  conformación  actual  de 
este  mercado.  La  Organización  Mundial  de  la  Salud,  así  como  el  Fondo  de  Naciones  Unidas  para  la  Niñez 
(Unicet)  y la  Organización  Panamericana  de  la  Salud  (OPS),  están  embarcadas  en  el  objetivo  de  generali- 
zar la  inmunización  de  la  población  infantil  a escala  mundial.  Existen  evidencias  de  estas  acciones  en  los 
importantes  niveles  de  inmunización  logrados,  de  acuerdo  al  informe  WHO  de  1996  el  80%  de  la  población 
infantil  mundial  está  vacunada  contra  la  difteria,  tétanos  y pertussis  (Triple  bacteriana  DTP)  y también  con- 
tra sarampión  y poliomielitis  se  verifica  una  creciente  utilización  de  las  vacunas  HB  y 1 1 ib.  Los  esfuerzos  de 
estos  organismos  se  han  plasmado  en  una  serie  de  iniciativas  de  modo  de  contribuir  con  la  atención  de  la  de- 
manda de  vacunas  de  países  subdesarrollados  o emergentes.  Con  este  objetivo  realizan  grandes  compras  de 
vacunas  lo  que  les  permite  tener  influencia  sobre  los  precios  a los  que  se  comercializan.  (Temporao.  2002) 
Estos  hechos  brevemente  detallados  indican  que  actualmente  el  mercado  de  vacunas  se  estructura  en  base 
a dos  seamentos:  las  vacunas  tradicionales  de  uso  difundido  y bajo  precio  y las  vacunas  modernas,  con 
precios  elevados  y de  uso  restringido.  En  cuanto  a la  tipología  de  las  empresas  se  puede  clasificar  en  tres 
grupos  (Temporao,  2004) 

- Empresas  multinacionales  con  alta  tasa  de  innovación  tecnológica  y amplio  acceso  a los  mercados  inter- 
nacionales. 

- Empresas  públicas  y privadas  tradicionales  en  países  industrializados  con  gran  capacidad  de  producción 
de  vacunas  tradicionales  y acceso  a la  producción  de  nuevos  productos  a través  de  licencias. 

- Productores  públicos  de  países  en  desarrollo  con  una  producción  significativa  de  vacunas  tradicionales  y 
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potencial  acceso  a productos  modernos. 


La  industria  de  vacunas  modernas,  puede  considerarse  una  industria  biotecnología  (Shao,  2010),  carac- 
terizada por  un  alto  umbral  de  acceso  para  las  empresas,  dado  que  su  desarrollo  involucra  diversos  actores 
desde  agencias  de  gobierno,  institutos  de  investigación  y desarrollo  y empresas  manufactureras. 


Ln  el  segmento  de  vacunas  modernas  existen  asimetrías  entre  la  industria  de  países  desarrollados  y subde- 
sarrollados. De  modo  similar  a la  industria  bio- farmacéutica,  éstas  son  producto  de  los  diferentes  niveles 
de  desarrollo  científico-  tecnológico  de  los  países  y,  como  consecuencia  del  manejo  de  su  conocimiento 
central,  pero  además  la  gran  incertidumbre  que  implica  los  largos  períodos  que  necesita  el  proceso  de 
desarrollo  de  una  vacuna  y sus  costos  hundidos,  así  como  el  requerimiento  de  activos  complementarios 
que  no  siempre  controla  la  industria,  lodos  estos  factores  constituyen  una  profundizaeión  de  las  asimetrías 
mencionadas. 

Cuando  se  analiza  el  mercado  en  términos  de  volumen,  sólo  el  14  % de  las  vacunas  requeridas  para  satis- 
facer la  demanda  global  proviene  del  segmento  de  vacunas  modernas,  por  lo  demás  existe  un  gran  mercado 
del  orden  del  80%  de  la  población  mundial,  satisfecho  por  productores  de  vacunas  tradicionales  de  bajo 
costo. 

Kl  informe  de  la  Organización  Mundial  de  la  Salud  del  2009  da  cuenta  de  un  crecimiento  de  la  participación 
en  el  mercado  de  vacunas  tradicionales  de  productores  de  vacunas  de  países  en  desarrollo.  Al  respecto 
menciona  que,  en  el  año  2000  el  39%  de  las  dosis  de  vacunas  compradas  por  organismos  internacionales 
provino  desde  oferentes  de  esos  países  y en  el  año  2007  esta  proporción  fue  del  60%. 

Los  países  emergentes  se  ajustan  a "planes  nacionales  de  vacunación”  de  los  que  forman  parte  vacunas 
contra  enfermedades  infecciosas,  altamente  contagiosas  y para  las  que  existen  vacunas  tradicionales  hace 
ya  muchos  años.  Lstos  planes  son  atendidos  por  los  gobiernos  con  la  participación  de  los  organismos  inter- 
nacionales antes  mencionados.  Además  existen  vacunas  para  enfermedades  no  incluidas  en  los  programas 
nacionales  que  participan  de  una  inmunización  no  planeada,  son  distribuidas  por  los  canales  tradicionales 
de  las  empresas  y compradas  en  forma  directa  por  la  población. 

A nivel  global  el  mercado  de  vacunas  modernas  ha  seguido  claramente  el  comportamiento  oligopólico  de  la 
"gran  industria  farmacéutica",  dónde  algunas  de  sus  empresas  son  grandes  jugadores  en  este  segmento.  En 
este  contexto  esa  "gran  industria”  ha  dejado  de  lado  la  producción  de  vacunas  económicas  de  uso  difundido, 
reservando  sus  antígenos  para  vacunas  más  complejas  o modernas. 

Se  abriría  de  este  modo  una  oportunidad  de  producción  de  antígenos  al  mundo  subdesarrollado,  mostrando 
ventanas  de  oportunidad  para  países  de  desarrollo  científico  tecnológico  intermedio  que  se  propongan  como 
objetivo  participar  de  este  mercado.  Dentro  de  los  objetivos  de  este  trabajo  se  plantea  conocer  en  detalle 
la  situación  en  que  se  encuentra  la  provisión  de  vacunas  en  la  Argentina.  La  realidad  local  es  parte  de  la 
realidad  global  donde  los  dos  segmentos  de  vacunas  participan.  Según  el  criterio  adoptado  por  el  Ministerio 
de  Salud  de  la  Nación  las  vacunas  que  conforman  el  "Calendario  Nacional  de  Vacunación”  en  nuestro  país 
son,  a partir  del  segundo  semestre  del  año  2009: 

- BCG  (tuberculosis) 


- HB  (Hepatitis  B) 


- DPT-HB-Hib:  (Pentavalente)  Difteria,  tétanos,  pertussis,  l lep  B.  I laemophilus  influenza  b 
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- DPT-Hib:  (Cuádruple)  difteria,  tétanos,  pertussis,  Haemophilus  inlluenza  b). 

- OPV  (Sabin)  Vacuna  antipoliomelitica  oral. 

- SRP:  (Triple  Viral):  Sarampión.  Rubéola,  Parotiditis 

- HA  (Hepatitis  A) 

- DP  T:  (Triple  Bacteriana):  difteria,  tétanos,  pertussis. 

- Dtap:  ( Triple  bacteriana  acelular) 

- DT:  (Doble  bacteriana)  Difteria  y tétanos 

- SR:  (Doble  viral)  Sarampión,  Rubéola 


- FA:  (Fiebre  Amarilla)  Una  dosis  para  residentes  a zonas  de  riesgos. 


- FHA:  (Fiebre  Hemorrágica  Argentina)  una  dosis  para  residentes  o viajeros  a zonas  de  riesgo. 

La  provisión  de  estas  vacunas  es  responsabilidad  del  Fstado  así  como  asegurar  la  vacunación  en  todo  el 
país. 

Además  existe  la  distribución  de  vacunas  no  planeadas  o no  incluidas  en  el  Programa  Nacional  de  Vacu- 
nación cuya  provisión  se  realiza  generalmente  a través  de  las  cadenas  de  distribución  farmacéuticas. 

En  el  país  existen  solamente  dos  organismos  públicos  que  producen  vacunas:  el  Instituto  Biológico  de  La 
Plata,  dependiente  del  Ministerio  de  Salud  de  la  Provincia  de  Buenos  Aires  y el  Anlis-  Malbrán.  Estos  in- 
stitutos cuentan  con  años  de  experiencia,  conocimiento  y aprobación  de  normas  técnicas  en  la  fabricación 
de  algunas  vacunas  de  acuerdo  a normas  internacionales,  que  son  monitoreadas  por  la  QMS  y la  OPS.  Las 
técnicas  con  las  que  se  producen  vacunas  localmente  son  clásicas  o tradicionales.  De  todas  formas  son  muy 
pocas  las  vacunas  y la  cantidad  de  dosis  que  producen  estos  organismos;  el  resto  son  importadas  de  países 
de  desarrollo  científico  intermedio  como  India.  Bulgaria  y Dinamarca,  entre  otros. 


A modo  de  síntesis  puede  decirse  que  los  grandes  jugadores  que  controlan  el  segmento  de  vacunas  mod- 
ernas han  construido  barreras  para  el  acceso  al  conocimiento  científico  tecnológico,  siendo  ésta  una  de  las 
barreras  más  relevantes,  además  de  los  controles  de  las  redes  de  distribución  y de  los  gastos  en  publicidad 
y propaganda.  Esto  configura  un  mercado  con  altos  márgenes  de  beneficios  y con  un  uso  limitado  para  los 
países  desarrollados  y algunos  de  desarrollo  intermedio. 


No  obstante,  más  del  80%  de  la  población  mundial  es  abastecida  con  vacunas  tradicionales;  de  este  modo, 
cabe  interrogarse  si  la  entrada  de  las  empresas  de  países  en  desarrollo  en  este  segmento  de  vacunas  moder- 
nas. es  complementaria  al  desarrollo  en  el  segmento  tradicional. 


De  existir  complementariedad,  el  segmento  tradicional  sería  el  punto  de  partida  de  una  estrategia  dual  para 
países  de  desarrollo  científico-  tecnológico  intermedio  que  se  propongan  desarrollar  vacunas  biotecnológi- 
cas  y de  este  modo  generar  una  plataforma  de  lanzamiento  a esta  industria. 

Por  todo  lo  expuesto  solicito  a mis  pares  el  acompañamiento  del  presente  proyecto. 
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RESUMEN 

En  esta  serie  de  trabajos  se  propone  ofrecer  una  descripción  panorámica  acerca  de  los  actuales  empleos  de 
la  Teoría  de  las  Relaciones  Cuantitativas  de  Estructra  Actividad  (Propiedad)  (QSAR/QSPR)  para  predecir 
actividades  biológicas  y propiedades  fisicoquímicas  de  las  sustancias  químicas.  En  esta  primera  parte  se 
brinda  una  introducción  general  al  tema,  señalando  las  principales  características  de  esta  metodología  así 
como  sus  campos  de  aplicación. 

ABSTRACT 

In  this  series  of  articles  vve  give  an  overview  on  the  present  applications  of  the  Quantitative  Structure  Activ- 
ity  (Property)  Relationships  (QSAR/QSPR)  to  predict  biological  activities  and  physical  chemistn.  proper- 
ties  of  Chemical  substances.  In  this  first  part  we  offer  a general  introduction  to  this  theme.  pointing  out  the 
main  features  of  this  methodology  as  well  as  its  application  fields. 


1.  La  Teoría  QSAR/QSPR 


El  continuo  interés  por  lograr  predecir  las  distintas  propiedades  fisicoquímicas,  biológicas  y farmacológi- 
cas en  sistemas  reales  conduce  indudablemente  a la  aplicación  de  métodos  derivados  de  la  Mecánica  Cuán- 
tica, con  el  fin  de  representar  adecuadamente  el  fenómeno  involucrado.  Esto  se  traduce  en  la  necesidad 
de  tener  en  cuenta  todas  las  interacciones  presentes  en  el  sistema  físico  de  partículas,  lo  cual  hoy  por  hoy 
parece  ser  una  tarea  harto  dificultosa,  en  vista  de  que  los  cálculos  mecano-cuánticos  actuales  sólo  pueden 
resolverse  con  buena  aproximación  cuando  el  sistema  involucra  unos  pocos  átomos  no-interactuantes.  Si 
bien  el  uso  de  aproximaciones  matemáticas  permite  resolver  el  problema  de  partículas  interrelacionadas 
entre  sí.  debido  a la  incertidumbre  de  dicho  método,  no  siempre  será  posible  justificar  la  calidad  de  los  re- 
sultados encontrados.  Por  otro  lado,  los  cálculos  mecanocuánticos  ayudan  a la  comprensión  de  los  aspectos 
mecanísticos  que  originan  a las  propiedades  en  cuestión,  pero  no  resultan  la  herramienta  adecuada  para  el 
estudio  del  efecto  que  tiene  la  estructura  molecular  sobre  las  propiedades  macroscópicas  de  las  sustancias 
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químicas. 

La  leoría  QSARQSPR,  (Relaciones  Cuantitativas  Estructura-Actividad/Estructura-Propiedad)  ofrece  una 
alternativa  a la  hora  de  calcular  las  propiedades  de  una  colección  de  moléculas.  Cuando  nos  detenemos 
a observar  un  conjunto  de  estructuras  moleculares  junto  con  sus  propiedades  experimentales  medidas,  la 
pregunta  inmediata  que  surge  es  ¿existirá  una  correlación  directa  entre  la  propiedad  y la  estructura  de  estas 
sustancias?  La  respuesta  es  afirmativa,  y es  la  hipótesis  principal  de  la  Teoría  QSARQSPR.  La  misma  es 
una  hipótesis  matemática  fundamentada  en  el  hecho  de  que  la  estructura  de  una  molécula  es  la  principal 
responsable  de  sus  propiedades  químicas,  fisicoquímicas,  biológicas  o farmacológicas1 3.  Quizás  una  de  las 
premisas  fundamentales  de  la  teoría  es  el  Principio  de  Similaridad  Estructural,  que  establece  que  estruc- 
turas moleculares  similares  poseen  propiedades  similares,  mientras  que  estructuras  moleculares  diferentes 
manifiestan  propiedades  diferentes4.  Si  bien  es  conocido  desde  hace  mucho  tiempo  el  hecho  de  que  dis- 
tintas sustancias  tienen  diferentes  efectos  biológicos,  el  avance  en  la  determinación  de  estructuras  permitió 
establecer  relaciones  estructura-actividad  (SAR),  las  cuales  evidencian  ciertos  efectos  en  las  actividades 
biológicas  a partir  del  cambio  en  la  estructura  química  de  un  determinado  compuesto. 


Los  modelos  QSAR  también  nacen  en  el  campo  de  la  Poxieología.  De  hecho,  los  intentos  por  cuantificar 
relaciones  entre  la  estructura  química  y la  toxicidad  aguda  han  sido  parte  de  la  literatura  toxicológica  por 
más  de  100  años.  Las  primeras  evidencias  se  remontan  al  año  1863,  cuando  en  la  defensa  de  su  tesis  en  la 
l niversity  of  Strasbourg,  Strasbourg.  Francia,  J.  Cross  notó  las  relaciones  existentes  entre  la  toxicidad  de 
alcoholes  alifáticos  primarios  y su  solubilidad  en  agua.  Esta  relación  demuestra  el  axioma  central  del  mod- 
elado de  la  relación  estructura-toxicidad.  Por  lo  tanto,  existen  interrelaciones  entre  estructura,  propiedades 
y toxicidad.  Casi  un  siglo  después  Corvvin  Hansch  et  al5,  publicó  su  famoso  artículo  sobre  la  actividad 
biológica  de  grupos  de  compuestos  congéneres  v con  ello  sentó  la  base  para  el  desarrollo  de  la  actual  Teoría 
QSAR/QSPR. 


La  Teoría  QSAR/QSPR  busca  cuantificar  las  relaciones  SAR  a través  del  desarrollo  de  modelos,  y combina 
métodos  de  la  Estadística  Matemática  con  la  Química  Computacional.  Tales  modelos  se  vuelven  vitales  a 
la  hora  de  predecir  el  valor  de  la  propiedad  de  una  sustancia  si  ésta  es  desconocida  por  resultar  difícil  de 
adquirir,  sea  por  su  inestabilidad  química,  su  toxicidad  respecto  de  la  salud  humana,  su  costo  económico, 
etc.  Así  también  la  teoría  ha  sido  ampliamente  utilizada  para  el  diseño  y optimización  de  compuestos  tipo- 
droga.  y hasta  fue  fructíferamente  empleada  para  inferir  resultados  sobre  los  mecanismos  de  reacción  de 
compuestos  orgánicos. 


Con  el  fin  de  establecer  un  modelo  de  cuantifícación  apropiado,  un  requisito  indispensable  es  disponer  de 
un  conjunto  de  moléculas  para  las  cuales  se  conocen  perfectamente  los  valores  experimentales  de  la  propie- 
dad estudiada.  El  diseño  de  un  modelo  implica  su  calibración  y su  posterior  validación.  La  calibración  es- 
tablece con  exactitud  la  correspondencia  entre  la  estructura  y la  propiedad  analizada  a través  de  la  creación 
del  modelo  y determinación  de  los  parámetros  ajustables  de  los  que  depende.  La  función  matemática  (lineal 
o no-lineal)  que  cuantifica  la  relación  estructura-propiedad  se  elige  de  forma  arbitraria  y la  simplificación 
del  modelo  matemático  dependerá  de  aquella  expresión  que  determine  las  mejores  predicciones.  La  vali- 
dación certifica  la  veracidad  del  modelo  obtenido,  es  decir,  verifica  si  posee  o no  un  poder  predictivo  sobre 
moléculas  no  contempladas  en  el  ajuste  del  modelo,  y que  también  deben  poseer  información  conocida  de 
la  propiedad  experimental. 

pero,  ( cómo  representar  fielmente  las  relaciones  entre  la  estructura  y la  propiedad?  Desafortunadamente  no 
existe  una  vinculación  directa  entre  ambas  características,  por  lo  cual  la  teoría  se  vale  de  distintos  índices 
numéricos  que  codifican  la  información  estructural  y ayudan  a establecer  las  relaciones  buscadas,  estos 
índices  son  los  denominados  descriptores  moleculares. 
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2.  Los  Descriptores  Moleculares 

Más  estrictamente,  un  descriptor  molecular  es  el  resultado  final  de  una  lógica  y de  un  procedimiento 
matemático  que  transforma  la  información  química  codificada  dentro  de  una  representación  simbólica  de 
una  molécula  en  un  número  útil  o el  resultado  de  algún  experimento  estandarizado'1.  Estas  variables  pueden 
ser  teóricas  o experimentales,  pueden  describir  a la  molécula  como  un  todo  (descriptores  globales)  o sólo 
pueden  representar  un  fragmento  presente  en  ella  (descriptores  fragmentos).  Generalmente,  un  gran  número 
de  descriptores  moleculares  surgen  de  diferentes  teorías,  tales  como  la  Teoría  de  Orbitales  Moleculares,  la 
Teoría  de  Grafos  y la  Mecánica  Cuántica,  entre  otras. 


Ahora  bien,  puede  suceder  que  una  combinación  apropiada  de  números  describa  adecuadamente  la  propie- 
dad en  cuestión,  pero  que  no  dejen  de  ser  eso,  sólo  “simples  números".  Así,  es  requisito  fundamental  que  los 
descriptores  posean  algún  tipo  de  interpretación  química,  y si  ese  no  fuera  el  caso,  que  sí  puedan  derivarse 
en  base  a la  estructura.  Un  ejemplo  clásico  de  descriptor  lo  constituye  el  número  de  átomos  de  una  especie 
química  en  la  molécula,  como  la  cantidad  de  átomos  de  carbono  en  una  familia  de  bencenos  o él  numero  de 
átomos  de  cloro  en  especies  clorofluorocarbonadas;  la  cantidad  de  enlaces  C-C  puede  ser  otro  ejemplo  de 
descriptor.  Otros  descriptores  relacionados  con  propiedades  fisicoquímicas  pueden  ser  el  índice  de  refrac- 
ción, las  entalpias  de  vaporización  (AHv),  el  coeficiente  de  partición  octanol/agua  (Kow).  los  puntos  de 
ebullición,  los  volúmenes  molares,  etc. 


A continuación  describiremos  los  rasgos  más  relevantes  de  algunas  de  las  familias  de  descriptores  molecu- 
lares más  frecuentemente  utilizados  en  la  representación  de  la  estructura  molecular.  No  profundizaremos  en 
detalle  en  cada  una  de  ellas  debido  a lo  amplio  y extenso  del  tema.  El  lector  interesado  en  este  asunto  podrá 
consultar  la  bibliografía  señalada  en  este  análisis. 


2.1.  Descriptores  de  la  Teoría  de  Grafos  Química 

La  Teoría  de  Grafos  es  una  rama  de  la  Matemática  Discreta  relacionada  a la  topología  y a la  combinatoria, 
y está  vinculada  con  la  manera  en  que  los  objetos  están  conectados.  Un  grafo  es  una  representación  bidi- 
mensional  de  la  molécula.  Estructural  mente,  un  grafo  puede  verse  como  un  conjunto  de  vértices  o nodos, 
unidos  por  medio  de  aristas  o arcos,  en  la  representación  molecular  los  nodos  serían  los  átomos  y las  aristas 
los  enlaces.  Por  ejemplo  en  el  benceno  los  átomos  C son  los  nodos  y los  enlaces  C-C  las  aristas. 

Los  descriptores  que  se  obtienen  a partir  de  la  Teoría  de  Gratos  sólo  proporcionan  información  de  consti- 
tución y conectividad  y,  por  tanto,  no  pueden  discernir  isómeros  de  una  misma  molécula.  Se  pueden  definir 
diversos  tipos  de  índices  topológicos  y entre  los  más  conocidos  tenemos  a los  dos  siguientes: 


r\7 


índice  de  Wiener  (W) 


W ■ t donde  representa  la  distancia  topológica  entre  los  vértices  v y v,  si  se  considera  el  camino  de 
loneitud  más  corta.  La  longitud  u orden  del  camino  es  el  número  de  aristas  que  lo  componen. 


Indice  de  conectividad  molecular  (x)x 


X <■>  2 (^e§;  ) donde  deg;  es  el  grado  de  degeneración  del  vértice  v y representa  el  número 


de  vértices  adyacentes  al  mismo. 


2.2.  Indices  de  la  Teoría  de  la  Información 
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A menudo  sucede  que  gran  cantidad  de  los  índices  topológicos  calculados  poseen  alto  grado  de  degener- 
ación. 1:1  concepto  de  degeneración  de  un  descriptor  molecular  se  aplica  a aquellos  descriptores  que  posean 
el  mismo  valor  numérico  para  estructuras  diferentes.  La  Teoría  de  la  Información  ofrece  una  alternativa 
para  disminuir  el  grado  de  degeneración  de  los  descriptores  topológicos.  La  aplicación  se  basa  en  darle  a la 
molécula  representada  por  un  grafo  una  cierta  distribución  de  probabilidad  respecto  a la  complejidad  que 
posea.  \ desde  allí  aplicar  la  Teoría  de  la  Información. 

2.3.  Descriptores  para  Interacciones  Químicas 

hstos  descriptores  caracterizan  las  interacciones  químicas  que  participan  en  la  molécula  tanto  a nivel  global 
como  local,  es  decir,  refiriéndose  a un  sector  de  la  molécula  o tratándola  como  un  todo.  Estas  interacciones 
implican  cambios  topológicos,  geométricos  y electrónicos,  por  lo  cual  los  descriptores  suelen  combinar 
algunos  de  estos  aspectos. 

2.4.  Descriptores  del  programa  Dragón' 

El  programa  Dragón X ofrece  la  posibilidad  de  calcular  un  gran  número  de  descriptores  moleculares  agru- 
pados en  diferentes  familias.  A su  vez,  la  lista  de  descriptores  proporcionados  puede  ser  organizada  como 
cerodimensionales  (01)).  unidimensionales  ( ID),  bidimensionales  (2D).  y tridimensionales  (3D).  Nosotros 
utilizaremos  esta  última  clasificación  para  simplificar  la  descripción.  Los  descriptores  calculados  en  este 
trabajo  son  obtenidos  con  la  aplicación  de  este  programa  y son  cantidades  teórico-definidas  y podemos 
destacar  que  no  se  utilizan  descriptores  experimentales. 

Descriptores  0D:  describen  solamente  la  constitución  de  la  molécula,  pero  no  dicen  nada  sobre  la  confor- 
mación ni  tipo  de  coneetividad  presente.  Los  más  simples  son  el  número  de  átomos  de  un  determinado  tipo, 
el  número  de  enlaces  y el  peso  molecular,  entre  otros. 

Descriptores  ID:  describen  fragmentos  de  las  moléculas  constituidos  por  el  agrupamiento  de  sus  átomos 
constituventes. 


Descriptores  21):  utilizan  una  función  de  autocorrclación  bidimensional  que  contiene  la  topología  del 
grafo.  v además  representa  la  distribución  de  una  propiedad  atómica  determinada  en  la  molécula.  La  propie- 
dad atómica  con  la  que  se  pesa/pondera  al  descriptor  depende  de  los  átomos  presentes  en  la  molécula  con 
lo  cual  se  pueden  seleccionar  aquellos  átomos  que  dan  mayor  peso  a la  variable.  Estos  descriptores  tienen 
en  cuenta  las  interacciones  Ínter,  intra-moleculares. 


Descriptores  3D:  esta  clase  tiene  en  cuenta  los  aspectos  conformacionales  de  la  estructura  molecular, 
considerando  de  esta  manera  las  propiedades  estereoquímicas  de  las  moléculas.  Para  su  cálculo  se  utili- 
zan estructuras  moleculares  previamente  optimizadas  con  métodos  convenientes,  tales  como  el  Método  de 
Campos  de  Euerza  de  la  Mecánica  Molecular  MML  en  combinación  con  métodos  derivados  de  la  Mecánica 
Cuántica,  sean  ah  initio  o Métodos  de  la  Teoría  de  Orbitales  Moleculares  Semiempírica.  Entre  estos 
descriptores  citamos  las  cargas  atómicas,  la  energía  del  orbital  molecular  más  alto  ocupado  ( e HOMO  ) y la 
energía  del  orbital  molecular  mas  bajo  desocupado  ( £lvmo  ).  entre  otros. 


Lln  descriptor  debe  cumplir  con  un  conjunto  de  características  tales  como: 
Cálculo  sencillo 

i.  Invarianza  respecto  de  la  traslación  y la  rotación 

ii.  Invarianza  respecto  a la  numeración  de  los  átomos 

v.  Buena  correlación  con  la  propiedad  estudiada 

Vm  Bajo  grado  de  correlación  con  otros  descriptores 
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3.  Sobre  el  Diseño  del  Modelo 


Durante  el  diseño  de  los  modelos  QSAR/QSPR  resulta  de  fundamental  importancia  seleccionar  los  descrip- 
tores moleculares  más  influyentes  para  predecir  la  propiedad  analizada.  Existen  dos  métodos  generales  para 
la  selección  de  descriptores  moleculares.  El  primero  de  ellos  consiste  en  valerse  de  la  experiencia,  de  las 
características  observables  y perceptibles  de  las  moléculas  de  estudio  y del  posible  mecanismo  subyacente. 
Por  ejemplo,  la  fotohidrólisis  es  una  de  las  vías  principales  para  la  fotolisis  de  compuestos  aromáticos  hi- 
drogenados y así  varios  descriptores  químicocuántícos  que  caracterizan  los  enlaces  C-X  lueron  calculados 
y empleados  para  el  desarrollo  de  modelos  QSAR  que  describan  los  rendimientos  cuánticos  de  íotólisis  de 
compuestos  halogenados10,  “.  Por  otro  lado,  el  segundo  método  se  basa  en  realizar  un  estudio  combinatoria! 
de  los  descriptores  estructurales  y seleccionar  aquellos  que  sean  más  predictivos. 


La  ortogonalización  de  los  descriptores  moleculares  busca  facilitar  el  desarrollo  de  un  modelo  óptimo,  re- 
duciendo así  el  número  de  descriptores  objeto  de  análisis  y la  dimensión  del  problema  matemático  a tratar, 
por  la  eliminación  de  la  intercorrelación  existente  entre  dichas  variables.  Sin  embargo,  se  ha  demostrado 
que  la  calidad  estadística  obtenida  con  el  uso  de  variables  no-ortogonales  no  difiere  de  la  hallada  con  vari- 
ables ortogonales. 


Las  moléculas  estándares  que  constituyen  el  llamado  conjunto  de  calibración  servirán  como  "moléculas  ob- 
jetivo", pues  representan  moléculas  a las  cuales  las  moléculas  de  validación  deberán  imitar,  copiar,  seguir, 
aproximarse  y lo  más  deseable,  superar  en  calidad  predictiva12.  Es  preciso  que  las  moléculas  del  conjunto 
de  validación  posean  estructuras  congruentes  con  las  del  conjunto  de  calibración,  pues  ello  influirá  directa- 


mente en  la  calidad  predictiva  del  modelo.  Una  determinada  selección  de  moléculas  de  calibración  y de 
validación  en  conjuntos  moleculares  homogéneos/heterogéneos  influenciará  considerablemente  en  los  re- 
sultados finales  que  se  obtengan  con  posterioridad  con  los  modelos  QSAR/QSPR,  y el  modelo  establecido 


tendrá  algún  significado  estadístico  en  la  medida  que  se  utilicen  conjuntos  adecuados. 


Finalmente,  es  esperable  que  un  modelo  sencillo  que  presente  error  de  predicción  de  la  propiedad  durante 
la  calibración  supere  el  proceso  de  validación,  en  comparación  de  uno  que  sea  más  exacto  y sin  error  de 
calibración,  pues  este  último  se  ajusta  excesivamente  o "memoriza"  al  conjunto  de  calibración  y de  esta 
manera  es  incapaz  de  predecir  la  propiedad  en  cuestión  durante  la  validación.  Se  busca  entonces  que  los 
errores  cometidos  por  el  modelo  en  la  etapa  de  calibración  sean  similares  a los  encontrados  durante  la  etapa 
de  su  validación. 


4.  Objetivo  Específicos 


El  objetivo  principal  de  la  presente  serie  de  artículos  consiste  en  estudiar  diferentes  técnicas  estadísticas  de 
diseño  molecular  que  permitan  el  armado  de  conjuntos  moleculares  de  calibración  y validación  balancea- 
dos. es  decir,  conjuntos  que  posean  similares  errores  de  predicción  de  la  propiedad.  Se  busca  así  seleccionar 
la  metodología  que  mejor  funcione  y así  implementarla  para  el  trabajo  de  investigación  QSAR/QSPR  co- 
tidiano. Para  ello,  se  abordan  las  técnicas:  Análisis  de  Agrupamiento  Jerárquico,  Análisis  de  Componentes 
Principales,  Análisis  Discriminante  Lineal,  Análisis  de  Agrupamiento  k-Medias  y k-vecinos  más  cercanos. 
La  formulación  de  relaciones  estructura-propiedad  está  basada  en  la  técnica  del  Análisis  de  Regresión 


Lineal,  v considera  los  aspectos  multidimensionales  de  la  estructura  por  medio  del  análisis  de  más  de  mil 
descriptores  moleculares  calculados  con  el  programa  Dragón.  Se  compara  la  bondad  de  estos  métodos  cla- 
sificadores de  objetos  sobre  tres  bases  de  datos  diferentes,  a saber:  solubilidades  acuosas  de  166  compues- 
tos orgánicos  tipo-droga.  128  actividades  anti-SIDA-1  de  compuestos  orgánicos,  y 470  toxicidades  acuosas 
en  compuestos  alitáticos  heterogéneos. 
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RESUMEN 

El  diseño  de  conjuntos  moleculares  balanceados  posee  gran  importance  como  paso  previo  al  tratamiento 
racional  empleando  la  teoría  QSAR/QSPR.  En  el  segundo  trabajo  de  esta  serie  describimos  de  manera 
general  los  métodos  más  estudiados  y aplicados  en  el  desarrollo  de  la  teoría  QSAR/QSPR.  tales  como:  el 
Análisis  de  Agrupamiento  Jerárquico,  el  Análisis  de  Componentes  Principales,  el  Análisis  Discriminante 
Lineal,  el  Análisis  de  Agrupamiento  k-Medias  y k-Vecinos  Más  Cercanos.  Si  bien  no  se  han  explorado 
totalmente  las  numerosas  técnicas  que  hoy  aparecen  en  la  literatura  estándar,  tratamos  de  considerar  a las 
más  importantes  de  ellas. 

ABSTRACT 

The  design  of  balanced  molecular  sets  has  a great  importance  as  a previous  step  to  the  rational  treatment 
employing  the  QSAR/QSPR  Theory.  In  the  second  anicle  of  this  series  we  describe  through  a general 
manner  the  most  usual  and  vvidely  applied  in  the  development  of  the  QSAR/QSPR  Theory.  such  as  the 
Uierarchical  Grouping  Analysis,  The  Principal  Component  Analysis,  the  Lineal  Discriminant  Analysis.  the 
Grouping  of  Neiahboring  k-Medias  and  k-Vicinal.  Although  we  have  not  analysed  all  the  numerous  avail- 
able  actual  techniques  appearing  in  the  standard  literature,  we  have  considered  the  most  important  ones. 

1.  El  Problema  de  la  Clasificación 

La  clasificación  es  el  proceso  de  división  de  un  conjunto  de  objetos  en  grupos  mutuamente  excluyentes,  de 
manera  tal  que  los  miembros  de  cada  grupo  se  hallen  lo  más  cerca  posible  el  uno  al  otro,  y los  de  diferentes 
grupos  lo  más  lejos  posible1.  La  cercanía  se  mide  respecto  a una  determinada  variable  que  forma  la  predic- 
ción. No  existe  en  general  una  regla  que  permita  definir  la  mejor  aproximación  a un  problema  de  clasifi- 
cación en  particular, 3,  pero  la  selección  adecuada  de  los  descriptores  moleculares  clasificadores  resulta  ser 
esencial  en  la  feoría  QSAR/QSPR. 
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Vna  de  las  estrategias  más  comunes  para  el  desarrollo  de  relaciones  cuantitativas  específicas  está  basada 
en  la  clasificación  de  moléculas  según  su  funcionalidad  química,  lo  cual  resulta  sencillo  desde  el  punto 
de  vista  práctico.  Sin  embargo,  puede  suceder  que  dos  moléculas  determinadas  tengan  los  mismos  grupos 
funcionales  y distinto  valor  en  sus  propiedades  macroscópicas,  lo  que  hace  este  esquema  de  clasificación 
un  tanto  problemático. 

Entre  las  técnicas  de  clasificación  de  datos  más  difundidas  en  la  literatura  encontramos  al  Análisis  de 
Componentes  Principales  (PC'A)4,  Análisis  Discriminante  (DA)3,  Análisis  de  Agrupamiento  (CAf.  y otras 
pertenecientes  al  campo  de  las  Redes  Neuronales  (ANN),  como  pueden  ser  las  Redes  Neuronales  de  Retro- 
Propagación  (BPNN)7  o los  Mapas  de  Auto-Organización  de  Kohonen  (SOM)x.  Por  su  parte,  la  Teoría 
de  la  Lógica  Difusa  (FLTf,  10  representa  una  herramienta  alternativa  del  área  de  la  Inteligencia  Artificia! 
aplicable  a problemas  de  clasificación,  y que  consigue  modelar  razonablemente  conceptos  difusos  relacio- 
nados a la  incerteza  o imprecisión.  Dentro  de  dicha  teoría  se  han  reportado  los  algoritmos  de  Agrupamiento 
Difuso  (PC)11  y de  Partición  Difusa  Adaptativa  (AFP)12. 

I I diseño  de  conjuntos  moleculares  balanceados  posee  gran  interés  como  paso  previo  al  tratamiento  ra- 
cional QSAR/QSPR.  Pn  el  segundo  trabajo  de  esta  serie  describimos  de  manera  general  los  métodos  más 
estudiados  y aplicados  en  el  desarrollo  de  la  teoría  QSAR/QSPR,  tales  como:  Análisis  de  Agrupamiento 
Jerárquico,  Análisis  de  Componentes  Principales,  Análisis  Discriminante  Lineal,  Análisis  de  Agrupamiento 
k-Medias  y k-Vecinos  Más  Cercanos.  Si  bien  no  se  han  explorado  totalmente  las  numerosas  técnicas  que 
hoy  aparecen  en  la  literatura,  tratamos  de  considerar  el  mayor  número  de  ellas. 

2,  Análisis  de  Componentes  Principales  (PCA) 

Uno  de  los  problemas  inherentes  en  Estadística  Multivariable  es  la  dificultad  de  visualización  de  datos 
que  dependen  de  gran  cantidad  de  variables.  Si  bien  un  simple  gráfico  en  dos  o tres  dimensiones  facilita 
la  interpretación,  la  existencia  de  cuatro  o más  variables  dificulta  la  visualización  de  las  relaciones  exis- 
tentes. Afortunadamente,  en  un  conjunto  de  datos  con  muchas  variables  los  grupos  de  variables  a menudo 
se  mueven  juntos.  Una  consecuencia  de  ello  es  que  más  de  una  variable  puede  ser  la  fuerza  impulsora 
que  gobierna  el  comportamiento  del  sistema,  con  lo  cual  estamos  frente  a un  problema  de  redundancia  de 
in  formación. 


Es  posible  simplificar  la  dimensión  del  problema  matemático  mediante  la  sustitución  de  un  grupo  de  vari- 
ables correlacionadas  (X)  por  una  única  nueva  variable  (PC).  El  Análisis  de  Componentes  Principales  es  un 
método  cuantitativamente  riguroso  basado  en  la  correlación  de  los  datos,  utilizado  para  llevar  a cabo  esta 
simplificación.  El  método  genera  un  nuevo  conjunto  de  variables,  llamadas  componentes  principales  (PC). 
Cada  uno  de  los  PC  es  una  combinación  lineal  de  las  d variables  originales,  y que  resultan  ortogonales  entre 
sí.  con  lo  cual  no  existe  información  redundante: 


PC  = y a X 

1 Zj  J'1  J 


(i) 


En  esta  ecuación.  PC  es  el  i-ésimo  componente  principal,  y a es  el  coeficiente  de  lay-ésima  variable  para 
ese  componente. 

El  numero  de  componentes  principales  coincide  con  el  número  de  variables  independientes  utilizadas  para 
derivarlos.  En  la  práctica,  para  un  problema  particular  se  selecciona  el  número  de  PC  de  manera  que  la 
suma  de  las  varianzas  de  los  primeros  PC  exceda  el  80%  de  la  varianza  total  de  los  datos  originales.  Cada 
componente  principal  se  extrae  en  orden  decreciente  de  varianza  explicada  por  tal  componente  en  el  con- 
junto de  datos.  Una  vez  que  se  ha  eliminado  la  redundancia,  sólo  los  primeros  componentes  son  requeridos 


Anales  de  la  Sociedad  Científica  Argentina  • Volumen  246  N'1  1 • 2012  • Püg.  33 


para  describir  la  mayor  parte  de  la  información  contenida  en  el  conjunto  original  de  datos,  tiste  enfoque 
ayuda  a separar  los  componentes  importantes  de  aquellos  que  sólo  expliquen  una  variabilidad  al  azar. 


Existen  infinitas  formas  de  construir  una  base  ortogonal  para  el  espacio  de  los  datos,  por  lo  cual:  ¿qué  hay 
de  especial  en  el  conjunto  de  componentes  principales?  Aquí,  el  primer  componente  principal  (PC  1)  es 
un  eje  sencillo  cuya  dirección  es  convenientemente  elegida  en  el  espacio.  Cuando  se  proyecta  cada  obser- 
vación sobre  el  eje  PCI,  los  valores  resultantes  forman  una  nueva  variable  denominada  coordenada  PCI, 
cuya  varianza  es  máxima  respecto  de  toda  posible  elección  del  primer  eje.  El  segundo  componente  (PC2) 
es  otro  eje  perpendicular  al  primero;  si  se  proyectan  las  observaciones  sobre  este  eje  se  genera  una  nueva 
variable  denominada  coordenada  PC2,  cuya  varianza  es  la  máxima  entre  todas  las  opciones  posibles  del 
segundo  eje.  Los  componentes  restantes  se  toman  ortogonales  a los  previamente  seleccionados  y describen 
la  varianza  máxima  de  los  datos. 


Ventajas  y desventajas  del  método  PCA 


Ventajas; 

• Puede  constituir  un  camino  para  determinar  la  dimensionalidad  efectiva  de  un  conjunto  de  datos. 

• Al  ser  los  PC  ortogonales  entre  sí,  las  comparaciones  hechas  entre  objetos  con  respecto  a sus 
coordenadas  en  un  dado  PC/  no  están  correlacionadas  con  comparaciones  que  estén  basadas  en  las  coorde- 
nadas en  otro  PC/. 


Desventajas 

• Es  frecuente  no  encontrar  interpretación  alguna  de  los  componentes  obtenidos.  Cada  componente 
es  una  combinación  lineal  de  variables  que  reflejan  distintas  características  de  las  observaciones. 

• Los  componentes  principales  no  son  invariantes  a transformaciones  lineales  de  las  variables.  Pol- 
lo tanto,  las  componentes  se  modifican  si  las  variables  se  estandarizan. 


3.  Análisis  Discriminante  Lineal  (LDA) 


En  el  Análisis  Discriminante,  el  punto  de  partida  es  un  conjunto  de  objetos  clasificados  en  dos  o más  gru- 
pos. De  estos  objetos,  se  conocen  sus  variables  atributo.  Al  reconocer  de  antemano  la  existencia  de  estos 
grupos,  parece  lógico  pensar  que  existen  variables  cuyo  valor  numérico  determina  la  pertenencia  a uno  u 
otro  grupo.  Los  objetivos  del  Análisis  Discriminante  son: 

i.  La  identificación  de  variables  atributo  que  mejor  discriminen  entre  los  grupos  y la 

evaluación  del  poder  discriminante  de  cada  una  de  ellas. 


ii.  Asignar,  con  un  cierto  grado  de  riesgo,  un  objeto  del  que  no  se  conoce  su  clasificación  y del 
que  se  conocen  las  variables  atributo. 


Como  técnica  de  análisis  de  dependencia,  LDA  permite  obtener  un  modelo  lineal  de  causalidad  en  el  cual 
la  variable  dependiente  puede  ser  métrica  o categórica,  y las  variables  independientes  son  métricas,  con- 
tinuas v determinan  a qué  grupo  pertenecen  los  objetos.  Se  trata  de  encontrar  relaciones  lineales  entre  las 
variables  que  mejor  discriminen  a los  grupos  iniciales  de  objetos.  Además,  se  trata  de  definir  una  regla  de 
decisión  que  asigne  un  nuevo  objeto  a uno  de  los  grupos  prefijados.  Para  más  información  sobre  el  método 
LDA  v la  manera  con  que  asignan  objetos,  ver  Apéndice,  sección  1. 


Ventajas  y desventajas  del  método  LDA 
Ventajas: 


La  técnica  LDA  es  fácil  de  aplicar. 
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Las  probabilidades  de  pertenencia  a un  grupo  dado  son  fáciles  de  obtener. 

Está  disponible  en  muchos  programas  estadísticos. 

Desventajas: 

Las  suposiciones  de  normalidad  e igualdad  de  varianzas  no  siempre  se  cumplen  en  las  variables 
del  modelo. 

La  clasificación  de  nuevas  observaciones  no  es  muy  eficiente  a medida  que  se  incrementa  el 
número  de  variables  del  modelo.  Se  acostumbra  a seleccionar  variables  antes  de  aplicar  LDA. 

* Requiere  que  se  especifiquen  los  grupos  del  conjunto  de  entrenamiento  del  modelo  con  clases 

prefijadas. 


4.  Análisis  de  Ágrupamiento 

El  análisis  de  agolpamiento,  también  llamado  análisis  de  segmentación  o análisis  de  taxonómico,  crea  gru- 
pos o agrupaciones  de  datos.  Estas  agrupaciones  están  formadas  de  tal  manera  que  los  objetos  en  el  mismo 
grupo  son  muy  similares  y los  objetos  en  grupos  diferentes  son  muy  distintos.  Podemos  encontrar  distintos 
tipos  de  análisis,  divididos  generalmente  en  dos  grandes  categorías: 

• Jerárquicos:  construyen  una  jerarquía  de  agrupamiento 

• Partieionamiento:  el  número  de  grupos  se  determina  de  antemano  y las  observaciones  se  asignan 
a tales  grupos  según  su  proximidad  o cercanía. 


4.1.  Análisis  de  Agrupamiento  Jerárquico  (MCA) 


Agrupa  los  objetos  mediante  la  creación  de  un  árbol  jerárquico  o dendrograma.  El  árbol  no  es  simplemente 
un  conjunto  de  grupos,  sino  más  bien  una  jerarquía  de  múltiples  niveles,  donde  los  agrupamientos  en  un 
nivel  dado  aparecen  unidos  como  agrupamientos  del  nivel  siguiente.  Ello  permite  decidir  el  nivel  o grado 
de  agrupamiento  que  resulta  más  apropiado  para  la  aplicación  particular.  Uno  de  los  pasos  más  importantes 
del  MCA  lo  constituye  la  búsqueda  de  similitud  o disimilitud  entre  los  objetos  en  el  conjunto  de  datos,  por 
lo  cual  existe  una  gran  variedad  de  formas  de  calcular  esta  medida.  Para  llevar  a cabo  un  HCA  se  sigue  el 
procedimiento  a continuación: 

a.  Encontrar  la  similitud  o disimilitud  entre  los  objetos 


En  este  paso  se  calcula  la  distancia  entre  cada  par  de  objetos  para  un  método  de  medida  definido.  En  el  caso 
de  un  conjunto  de  datos  formado  por  m objetos,  existen  m(m  - 1)  pares  posibles,  y las  distancias 

2 

generadas  para  dichos  pares  conducen  a una  matriz  distancia  o disimilaridad.  La  medida  de  distancia  entre 
objetos  más  comúnmente  utilizada  es  la  distancia  Euclídea.  Sin  embargo,  uno  podría  utilizar  otras  op- 
ciones como:  distancia  Euclídea  estandarizada,  distancia  Mahalanobis.  distancia  Manhattan,  o distancia 
Minkowski.  entre  otras,  más  información  en  A\péndice.  sección  II.  A veces  sucede  que  en  el  conjunto  de 
datos  utilizados  las  variables  poseen  diferentes  escalas  o diferentes  unidades.  Estas  discrepancias  pueden 
influir  directamente  a la  hora  de  realizar  el  cálculo  de  proximidad,  por  lo  cual  como  paso  previo  al  cálculo 
de  la  matriz  distancia  es  posible  estandarízar/normalizar  los  valores  de  los  datos  a fin  de  utilizar  la  misma 
escala  proporcional. 

b.  Agrupar  los  objetos  en  el  dendrograma 

En  este  paso  se  enlazan  los  objetos  o agrupamientos  más  próximos  entre  sí,  mediante  una  función  de  enlace 
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o vinculación.  La  función  de  vinculación  utiliza  la  información  de  las  distancias  obtenidas  en  el  paso  ante- 
rior. y asocia  inicialmente  los  pares  de  objetos  más  próximos  en  grupos  binarios.  A continuación,  vincula 
estos  grupos  con  otros  objetos  más  lejanos  para  crear  agrupamientos  binarios  de  mayor  tamaño,  hasta  que 
todos  los  objetos  del  conjunto  de  datos  original  forman  el  árbol  jerárquico.  Existen  diíerentes  métodos 
de  vinculación  disponibles,  los  métodos  difieren  entre  sí  en  la  forma  de  medir  la  distancia  entre  agrupa- 
mientos. Por  ejemplo,  el  método  de  Vinculación  Individual  utiliza  la  distancia  mas  cercana  entre  pares  de 
objetos  o grupos;  otro  caso  como  el  método  de  Vinculación  Promedio  utiliza  la  distancia  promedio  entre 
todos  los  elementos  en  cualquiera  de  las  dos  agrupaciones,  etc.  Más  detalles  se  presentan  en  el  Apéndice, 
sección  lll. 

c.  Especificar  el  grado  de  agrupamiento  buscado 

En  general,  pueden  crearse  agrupamientos  de  datos  si  se  detectan  agrupaciones  naturales  en  el  árbol 
jerárquico,  o sino  a través  de  realizar  un  corte  horizontal  arbitrario  del  dendrograma.  En  este  último  caso,  se 
busca  que  el  corte  horizontal  intersecte  las  líneas  verticales  del  gráfico,  y esto  genera  el  número  de  grupos 
dependiente  de  la  posición  del  corte. 

d.  I.  Representación  gráfica  de  i 1CA:  dendrograma 

La  jerarquía  creada  a través  de  la  generación  de  agrupamientos  binarios  mediante  las  Junciones  de  vincu- 
lación puede  ser  fácilmente  entendida  cuando  se  visualiza  gráficamente.  El  dendrograma  resultante  tiene 
la  siguiente  estructura: 


a.&  - 


1 .5 


* - 


:x 

a 


En  la  figura,  los  números  a lo  largo  del  eje  horizontal  representan  los  índices  de  los  objetos  en  el  conjunto 
de  datos  original,  mientras  que  el  eje  vertical  mide  la  distancia.  La  vinculación  entre  objetos  o grupos  se 
representa  como  líneas  en  forma  de  U invertidas.  La  altura  de  U señala  la  distancia  entre  grupos. 


d.2.  Verificación  de  disini i laridad 

En  un  árbol  de  agrupamiento  jerárquico,  cualquier  par  de  objetos  en  el  conjunto  de  datos  original  está 
eventualmente  vinculado  en  algún  nivel.  La  altura  de  la  vinculación  en  el  dendrograma  representa  la  dis- 
tancia entre  ambos  objetos,  y es  conocida  como  la  distancia  cofenética  para  el  par  de  objetos.  Una  manera 
de  medir  la  bondad  o precisión  del  árbol  de  agrupamiento  es  comparar  las  distancias  cofenéticas  con  las 
distancias  generadas  en  la  primera  etapa  del  análisis  (punto  a).  Si  el  agrupamiento  es  válido,  la  vinculación 
de  objetos  en  el  árbol  jerárquico  debería  tener  una  fuerte  correlación  con  la  distancia  entre  objetos.  El  co- 
eficiente de  correlación  cofenético  compara  ambas  distancias,  y un  valor  cercano  al  valor  uno  sugiere  que 
la  solución  de  agrupamiento  encontrada  representa  a los  datos. 
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d.3.  Verificación  de  consistencia 


1 na  manera  de  detectar  divisiones  naturales  en  los  datos  es  comparar  las  alturas  de  cada  enlace  en  el  árbol 
jerárquico  con  las  alturas  de  los  enlaces  vecinos  que  se  encuentran  por  debajo.  Un  enlace  que  está  aproxi- 
madamente a la  misma  altura  que  un  enlace  que  se  encuentra  por  debajo  sugiere  que  no  hay  divisiones 
claras  entre  los  objetos  unidos.  Se  dice  que  estas  vinculaciones  presentan  un  alto  nivel  de  consistencia,  pues 
la  distancia  entre  los  objetos  que  se  han  unido  es  semejante  a la  distancia  entre  los  objetos  que  contienen. 
Por  otro  lado,  un  enlace  cuya  altura  difiere  notablemente  de  la  altura  de  los  enlaces  inferiores  indica  que  los 
objetos  unidos  a ese  nivel  están  mucho  más  separados  entre  sí  de  lo  que  estaban  sus  componentes  cuando 
se  los  unió.  En  el  análisis,  los  \ ínculos  inconsistentes  pueden  indicar  los  bordes  de  una  división  natural  en 
el  conjunto  de  datos,  pues  detectan  regiones  donde  la  similaridad  entre  objetos  o grupos  cambia  abrupta- 
mente. 


Estos  vínculos  pre- 
sentan consistencia 


tan  inconsistencia  si  se 
comparan  con  vínculos  que 
están  por  debajo  de  ellos 


El  coeficiente  de  inconsistencia  compara  la  altura  de  un  vínculo  en  un  árbol  jerárquico  con  el  promedio 
de  las  alturas  de  los  vínculos  que  están  por  debajo  de  él  y permite  cuantificar  la  inconsistencia  relativa. 
Los  vínculos  que  unen  distintos  agrupamientos  tienen  altos  coeficientes  de  inconsistencia,  a diferencia  de 
aquellos  que  unen  grupos  indistintos,  que  tienen  un  bajo  valor  del  coeficiente. 

Ventajas  y desventajas  del  método  HCA 


Ventajas: 

• La  medida  de  la  distancia  es  el  único  factor  que  determina  al  agrupamiento. 

• No  es  un  método  iterativo,  por  lo  que  no  se  necesitan  soluciones  iniciales  y no  existen  problemas 
de  optimización  que  conduzcan  a mínimos  locales. 

• No  presenta  una  sensibilidad  apreciable  en  presencia  de  ruidos  (objetos  que  posean  cierta  ambigüe- 
dad respecto  al  agrupamiento  al  cual  pertenecen)13. 


Desventajas: 

• Resulta  ser  un  método  gráfico,  más  que  analítico.  El  número  de  agrupamientos  óptimo  ( k ) se 
obtiene  por  inspección  del  gráfico. 

• Requiere  que  se  especifiquen  los  grupos  del  conjunto  de  entrenamiento  del  modelo. 
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* La  interpretación  de  los  resultados  de  MCA  es  menos  directa.  Ls  necesario  armar  el  dendrograma 

y recién  ahí  se  podrá  saber  la  clasificación  asignada  a cada  objeto. 


4.2.  Análisis  de  Agrupamiento  k-Medias 


bn  este  método  de  agrupamiento  se  particionan  los  datos  de  una  matriz  X en  k grupos  mutuamente  ex- 
eluyentes.  A diferencia  de  la  técnica  MCA,  el  método  k-Medias  opera  sobre  observaciones  reales  en  lugar 
de  considerar  medidas  de  disimilitud  entre  objetos  o grupos,  y crea  por  tanto  un  único  nivel  de  agrupacio- 
nes 14.  Esto  hace  que  k-Medias  sea  a menudo  más  conveniente  que  el  agrupamiento  jerárquico  si  se  aplica 
para  la  clasificación  de  gran  cantidad  de  datos. 


El  k-Medias  trata  cada  observación  como  un  objeto  que  tiene  una  ubicación  en  el  espacio.  Luego  de  realizar 
un  proceso  iterativo,  identifica  una  partición  tal  que  los  objetos  dentro  de  cada  agrupamiento  estén  ubicados 
lo  más  cerca  posible  el  uno  al  otro,  y también  lo  más  lejos  posible  a otros  grupos.  Por  supuesto,  es  posible 
elegir  la  medida  de  la  distancia  y ello  dependerá  del  tipo  de  datos  que  se  analicen.  Cada  agrupamiento  de 
la  partición  se  caracteriza  por  sus  objetos  miembros  y por  su  centroide  o centro.  El  centroide  para  cada 
agrupamiento  es  el  punto  en  el  que  la  suma  de  las  distancias  de  todos  los  objetos  en  tal  agrupamiento  se 
hace  mínima.  El  tipo  de  distancia  utilizada  en  forma  predeterminada  suele  ser  Euclídea,  pero  al  igual  que 
en  HCAes  posible  escoger  distintas  opciones.  El  cálculo  de  los  centroides  proporciona  diferente  resultado 
dependiente  del  tipo  de  medida  de  distancia  empleado.  La  ubicación  final  del  centroide  se  determina  a 
través  de  un  proceso  iterativo,  que  generalmente  converge  a una  solución  que  es  mínimo  local  en  la  primera 
etapa  del  cálculo,  pero  en  la  segunda  etapa  en  la  mayoría  de  los  casos  alcanza  un  mínimo  global,  para  más 
información  ver  Apéndice,  sección  IV. 


Para  tener  una  idea  de  la  calidad  de  las  agrupaciones  generadas  por  k-Medias,  se  define  el  valor  silueta  para 
cada  objeto  i (s(i)).  El  valor  silueta  representa  una  medida  de  la  similitud  que  tiene  un  objeto  situado  en  un 
grupo  dado  respecto  a otros  pertenecientes  a grupos  vecinos.  Su  valor  numérico  cae  en  el  intervalo  [-1  1J. 
Un  valor  silueta  cercano  a 1 indica  la  buena  asignación  del  objeto  al  agrupamiento,  en  tanto  la  disminución 
del  indicador  empeora  la  calidad  de  la  asignación.  Si  s(i)  es  cercano  a cero,  resulta  indistinto  asignar  el 
punto  i a un  grupo  o a otro  grupo  vecino.  Si  5(0  es  negativo,  sugiere  que  el  objeto  se  asignó  a un  grupo  er- 
róneo. La  definición  del  parámetro  silueta  se  presenta  en  el  Apéndice,  sección  V. 

A partir  de  la  comparación  de  la  magnitud  de  los  valores  silueta,  es  posible  ajustar  el  valor  de  k a utilizarse 
en  la  clasificación.  El  siguiente  gráfico  silueta  constituye  un  ejemplo. 


Parámetros  silueta 


El  gráfico  representa  el  número  de  agrupamientos  producidos  en  función  del  parámetro  silueta. 
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Se  aprecia  que  muchos  de  los  objetos  en  el  tercer  agrupamiento  tienen  £(/)>(). 6.  por  lo  que  dicho  grupo 
está  bien  resuelto  de  las  agrupaciones  vecinas.  No  obstante,  se  puede  observar  que  el  primer  grupo  tiene 
muchos  objetos  con  valores  menores  de  $(/),  y que  el  segundo  grupo  presenta  inclusive  unos  pocos  valores 
negativos  del  parámetro,  lo  que  manifiesta  que  estos  dos  agrupamientos  no  están  bien  separados. 

Ventajas  y desventajas  del  método  k-Medias 

Ventajas: 

k-Medias  puede  producir  agrupamientos  más  estrictos  que  HCA,  especialmente  si  los  agrupa- 
mientos son  de  tipo  globular  15. 

• k-Medias  es  un  método  más  analítico,  si  se  compara  con  HCA. 

• La  determinación  de  los  centroides  es  automática  > no  se  requiere  información  adicional  sobre 
Lis  clases  presentes  en  el  conjunto  original  de  datos. 

Desventajas: 

• Fijar  el  número  de  agrupamientos  puede  hacer  dificultosa  la  selección  del  valor  óptimo  de  la 
variable  k. 

• Alta  sensibilidad  a la  posición  inicial  de  los  centroides  de  las  agrupaciones  en  el  método  iterativo. 
Con  el  fin  de  obtener  una  solución  óptima,  se  deben  realizar  varias  pruebas  con  distintas  posiciones  inicia- 
les de  los  centroides. 

• No  funciona  bien  con  agrupamientos  no-globulares. 

4.3.  Análisis  k- Vecinos  Más  Cercanos  (k-NN) 

I I análisis  de  vecinos  más  cercanos  consiste  en  estimar  el  valor  de  un  dato  desconocido  a partir  de  las  car- 
acterísticas del  dato  más  próximo,  según  una  medida  de  similitud  o distancia16.  Hste  análisis  tiene  propie- 
dades estadísticas  bien  establecidas  y es  fácil  de  aplicar  a sistemas  reales17.  Hl  método  de  vecinos  más 
cercanos  se  puede  extender  si  se  utiliza  no  uno,  sino  un  conjunto  de  datos  más  cercanos  para  predecir  el 
valor  del  nuevo  dato,  en  lo  que  se  conoce  como  k-vecinos  más  cercanos. 

Ll  k-NN  asume  que  todos  los  objetos  pertenecen  a un  conjunto  de  calibración  predeterminado,  y mediante 
una  medida  de  distancia  elegida  se  determinan  los  k objetos  más  cercanos  al  objeto  que  se  desea  clasifi- 
car. Se  trata  de  un  algoritmo  de  aprendizaje  inductivo  supervisado,  en  el  que  se  genera  una  función  que 
asigna  las  entradas  a salidas  deseadas.  Esto  significa  que  el  conjunto  de  calibración  incluye,  además  de  las 
propiedades  multidimensionales  utilizadas  para  el  reconocimiento  (variables  atributo),  clasificadores  para 
predecir  la  clase  a la  que  pertenecen  los  datos  de  entrada.  Por  ejemplo,  un  objeto  es  asignado  a una  deter- 
minada clase  si  ésta  es  la  clase  más  frecuente  entre  los  k objetos  de  entrenamiento  más  cercanos. 


Distancias  entre  el  punto  a clasificar  al 
conjunto  de  entrenamiento.  El  punto  negro 
representa  el  punto  a clasificar. 


Generación  de  un  conjunto  cuando  k=5. 
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El  método  k-NN  supone  que  los  vecinos  más  cercanos  conducen  a la  mejor  clasificación,  esto  se  hace  al 
considerar  todas  las  variables  atributos.  El  problema  de  tal  suposición  es  que  es  posible  que  existan  varios 
atributos  irrelevantes  que  dominen  sobre  la  clasificación,  así  los  atributos  relevantes  pierden  peso  de  de- 
cisión y la  clasificación  es  incorrecta.  Para  resolver  la  cuestión,  es  posible  asignar  un  peso  a las  distancias 
de  cada  atributo,  que  transfiere  mayor  importancia  a los  atributos  más  relevantes.  Otra  posibilidad  es  tratar 
de  asignar  los  pesos  con  objetos  conocidos  de  entrenamiento. 


La  mejor  elección  del  valor  de  k depende  fundamentalmente  de  los  datos;  generalmente  los  valores  altos  de 
k reducen  el  efecto  de  ruido  en  la  clasificación,  pero  crean  límites  entre  clases  parecidas.  El  valor  más  adec- 
uado de  esta  variable  corresponde  a aquel  que  provea  la  mejor  clasificación  de  los  datos  para  la  aplicación 
concreta.  La  exactitud  del  algoritmo  k-NN  puede  ser  profundamente  degradada  por  la  presencia  de  ruido  o 
características  irrelevantes,  por  lo  que  todos  los  datos  deben  estar  apropiadamente  estandarizados. 


Ventajas  y desventajas 
Ventajas: 

• Simple  uso.  Como  existe  un  conjunto  de  entrenamiento  con  la  clasificación  de  objetos  preestab- 
lecida en  el  mismo,  la  clasificación  de  nuevos  objetos  sólo  implica  la  medida  de  la  distancia  entre  objetos 
y no  requiere  de  un  cálculo  iterativo. 

• Debido  a que  se  cuenta  con  más  información  inicial,  la  clasificación  debería  ser  más  exacta,  si  las 
clases  iniciales  impuestas  son  las  correctas. 

Desventajas: 

• Requiere  información  adicional,  pues  es  necesaria  la  asignación  de  un  conjunto  de  entrenamien- 
to, para  lo  cual  se  debe  conocer  de  antemano  las  clases  iniciales;  esta  información  no  siempre  está  dis- 
ponible. 

Referencias  Bibliográficas 

1.  Mazzatorta.  P.,  Benfenati,  E..  Lorenzini,  P.,  Vighi,  M.,  QSAR  ¡n  Ecotoxicity:  An  OverView  of 
Modern  Classification  Techniques.  J.  Chem.  Inf.  Comput.  Sci.  2004,  44.  105. 

2.  Brown,  R.  D.,  Martin.  Y.  C.,  Use  of  Structure-Activity  DataTo  Compare  Structure-Based  Clus- 
tering  Methods  and  Descriptors  for  Use  in  Compound  Selection.  J.  Chem.  Inf.  Comput.  Sci.  1996.  39.  (3). 
572. 

3.  Marengo,  E.  T.,  R,  Linear  Discriminant  Hierarchical  Clustering:  A modeling  and  Cross- Val  idate 
Divisive  Clustering  Method.  Chemom.  Intel l.  Lab.  Sys.  1993,  19.  43. 

4.  Niemi.  G.  J..  Practical  Applications  of  Quantitative  Structure-Activity  Relationships  (QSAR)  in 
Environmental  Chemistry  and  Toxicology.  Kluvver  Academic  Publishing:  Dordrecht,  1990. 

5.  Hubert,  C.  .1.,  Applied  Discriminant  Analysis.  Wiley-lnterscienc:  New  York.  1994. 

6 L.  Kaufman,  R.,  P J..  Finding  Groups  in  Data:  An  Introduction  to  Cluster  Analysis.  Wiley-Inter- 

science:  New  York,  1990. 

7.  Hecht-Nielsen.  R.,  Proceedings  ofthe  International  Joint  Conference  on  Neural  Networks.  Wash- 
ington D.  C.,  1989:  p 531. 

8.  Kohonen.  T..  Self-Organizing  Maps.  Springer-Verlag:  Berlín.  2001. 

9.  H.T.  Nguyen,  W.,  E.  A.,  A First  Course  in  Fuzzy  Logic.  Third  Edition  (2006)  ed.;  Chapman&Hall/ 

CRC. 

10.  Zadeh,  L.  A..  Classification  and  Clustering.  Academic  Press:  New  York.  1977. 

11.  F.  Ros,  A.,  K..,  Pintore,  M.,  Chrétien,  J.  R.,  Flybrid  Systems  for  Virtual  Screening:  Interest  of 

Fuzzy  Clustering  Applied  to  Olfaction.  SAR&QSAR  Environ.  Res.  2000.  1 1,  281. 

12  Ros.  F.,  Taboureau,  O.,  Pintore,  M.,  Chrétien.  J.  R..  Development  of  predictive  models  bv  adap- 
tive  fuzzy  partitioning.  Application  to  compounds  active  on  the  central  nervous  system.  Chemom.  Intel. 


Anales  de  la  Sociedad  Científica  Argentina  • Volumen  246  N°  1 • 2012  • Pag.  40 


Lab.  Syst.  2003.  67,  29. 

Al..  Hoptmgcr.A.  J.,  Treating  Chemical  Diversitv  in  QSAR  Analysis:  Modeling  Diverse 
H1V-1  Integrase  Inhibitors  Using  4D  Fingerprints.  J.  Chem.  Inf.  Model.  2007.  47,  1945. 

14.  Matlab  7.0,  Ihe  MathWorks,  Ine.  http://ww\v.mathworks.com 

15.  Han.  J..  Kamber.  M..  Pei.  J.,  In  Data  Mining:  Coneepts  and  Teehniques.  2006. 

16.  Cover.  T.,  Hart.  P.  Nearest  neighbor  pattem  classification.  In  IEEE  Transactions  on  Information 
Theory.  1967:  Vol.  13,  p 2 1 . 

17.  D.  Aha.  D.  k..  M.  Albert.  Instance-based  learning  "Instanee-based  learning  algorithms”.  In  Ma- 
chine Learning.  1991;  p 37. 


Anales  de  la  Sociedad  Científica  Argentina  • Volumen  246  N1’  1 *2012*  Pag.  4 1 


APÉNDICE 


I.  Discriminación  y Clasificación  en  LDA 

Si  consideramos  una  matriz  de  atributos  o variables  independientes  X para  cada  objeto  que  pertenece  a una 
clase  G!  determinada,  este  conjunto  de  muestras  es  el  llamado  conjunto  de  entrenamiento  o calibración.  El 
problema  consiste  entonces  en  hallar  una  buena  predicción  de  la  clase  G(  de  un  objeto  considerado,  con  el 
uso  de  la  misma  distribución  del  conjunto  de  entrenamiento,  a través  de  los  valores  de  las  variables  A( . 

La  obtención  de  la  función  discriminante  incluye  una  serie  de  aproximaciones,  a saber: 

i.  las  funciones  densidad  de  probabilidad,  p{\  j G,  = 0)  y p(\  | G,  = 1 ) , son  ambas  distribuciones  normales. 

G|. 


¡i-  si  (|i„,Z(t ) >'  (gj-Z  i ) son  los  parámetros  media  y covarianza  de  G,=0  y G=l,  respectivamente,  se  supone 
que  las  covarianzas  son  iguales. 


Función  Discriminante  Lineal 

Es  posible  encontrar  una  relación  lineal  que  caracterice  a cada  objeto  según  los  valores  de  sus  atributos. 
De  esta  manera,  si  tenemos  un  conjunto  de  N objetos  de  los  que  se  conocen  D variables  explicativas,  y se 
observa  que  N de  ellos  pertenecen  a la  clase  Cj,  y los  N,  restantes  a la  clase  C2,  con  N+N,=N.  es  posible 
construir  una  función  lineal  en  base  a las  D variables  y puede  usarse  para  predecir  si  pertenece  a un  grupo 
u otro  con  una  probabilidad  determinada.  En  la  función  lineal: 


(Al.  I ) 


Z es  una  variable  clasificadora.  .V  es  la  i-é sima  variable  atributo,  y Á es  su  coeficiente.  El  objetivo  princi- 
pal de  tal  función  lineal  desde  el  punto  de  vista  de  la  varianza  consiste  en  responder  a la  pregunta  de  si  dos 
o más  srupos  son  significativamente  distintos  uno  a otro  respecto  a la  medida  de  una  variable  en  particular. 
Debe  tenerse  presente  que  si  la  media  de  una  variable  es  significativamente  diferente  en  varios  grupos, 
puede  decirse  que  esta  variable  discrimina  bien  entre  grupos. 

En  caso  de  que  sea  posible  identificar  más  de  dos  grupos  en  los  datos,  pueden  estimarse  funciones  discrimi- 
nantes múltiples,  cada  una  de  ellas  similares  a la  presentada  en  la  Ec.  (AI.  1 ).  Por  ejemplo,  cuando  se  tienen 


tres  ampos,  puede  estimarse:  1 ) una  función  para  discriminar  entre  el  grupo  I y los  grupos  2 y 3 combina- 
dos; y 2)  otra  función  para  discriminar  entre  el  grupo  2 y el  grupo  3.  Además,  se  pueden  considerar  sólo 
las  funciones  discriminantes  múltiples  que  resulten  más  significativas:  si  se  observan  los  coeficientes  es- 
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tandari/ados  de  las  variables  de  cada  una  de  las  funciones  escocidas,  cuanto  mayor  sean  estos  coeficientes, 
más  alta  es  la  contribución  a la  discriminación  especificada.  Finalmente,  pueden  considerarse  las  medias  de 
las  tunciones  discriminantes  significativas  para  analizar  entre  cuales  grupos  éstas  discriminan. 

II.  Tip  os  de  Medida  de  Distancia 

Sea  una  matriz  \ (mxn)  que  es  tratada  como  m vectores  fila.v  . xm.  Varios  tipos  de  medida  de  distan- 

cia que  son  posibles  definir  para  el  par  de  objetos  r y s,  con  x y x . se  incluyen  a continuación: 

i.  Distancia  Euclídea:  es  la  distancia  entre  dos  puntos  que  se  mide  en  el  espacio  euclídeo,  se  define  como 

= (xr  - xs)(xr - x¡y  ( A 1 1 . 1 ) 

ii.  Distancia  Euclídea  Estandarizada:  cada  coordenada  en  la  suma  cuadrática  se  pesa  inversamente  por  la 
varianza  muestral  de  esa  coordenada. 

C¡~  = (JC  - X )D  * (x  -X  ) (AI  1.2) 

r s v r s Z v r s ' 

donde  I)  es  la  matriz  con  elementos  diagonales  dados  por  v \ que  se  refiere  a la  varianza  de  la  variable  X 
sobre  los  m objetos. 


iii.  Distancia  Mahalanobis:  es  una  forma  de  determinar  la  similitud  entre  dos  variables  aleatorias  mul- 
tidimensionales.  A diferencia  de  la  distancia  Euclídea.  esta  medida  tiene  en  cuenta  la  correlación  de  las 
variables. 


d2rs=(xr-xs)\-l(xr-xs)  (AII.3) 

donde  V es  la  matriz  de  covarianza  muestral. 


iv.  Distancia  Manhattan:  aquí  la  distancia  entre  dos  puntos  es  la  suma  de  las  diferencias  (absolutas)  de  sus 
coordenadas. 

n 

(AII.4) 


v.  Distancia  Minkowski 


(Al  1.5) 


En  el  caso  especial  p=\,  la  distancia  Minkowski  coincide  con  la  distancia  Manhattan,  y para  el  caso  especial 
p= 2.  la  distancia  Minkowski  coincide  con  la  distancia  Euclídea. 


vi. 


Distancia  Coseno:  uno  menos  del  ángulo  incluido  entre  los  puntos  (en  forma  de  vector). 


(AIE6) 


v ¡ i Distancia  de  Correlación:  uno  menos  la  correlación  entre  los  puntos  (tratado  como  secuencias  de  va- 
lores). 


o.  -o(<\ 


t 


(AII.7) 
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donde 


v i i i . Distancia  l lammíng:  es  el  porcentaje  de  coordenadas  que  difieren. 

drs=(#(X'J*X‘j)/") 


(AI!. 8) 


NI.  Métodos  de  Enlace  o Vinculación 


En  el  método  1 ICA,  se  utiliza  una  función  vinculante  que  crea  un  árbol  de  agrupamiento  jerárquico  a partir 
de  las  distancias  entre  pares  de  objetos  previamente  obtenidas.  La  función  puede  utilizar  diversos  métodos 
de  vinculación,  los  cuales  difieren  en  la  forma  que  se  calculan  las  distancias  entre  los  agrupamientos. 

La  solución  que  se  obtiene  en  HCA  es  una  matriz  (m- 1 )x3  llamada  Q,  donde  m es  el  número  de  observacio- 
nes en  el  conjunto  original  de  datos.  Las  primera  y segunda  columnas  de  Q contienen  a los  índices  de  los 
agrupamientos  vinculados  de  a pares,  para  formar  el  árbol  binario.  La  tercera  columna  contiene  la  distancia 
de  vinculación  entre  los  agrupamientos  formados. 

La  siguiente  notación  se  utiliza  para  describir  los  distintos  métodos  de  vinculación: 

• Un  agrupamiento  r es  formado  a partir  de  los  agrupamientos  p y q 

• nr  es  el  número  de  objetos  en  el  agrupamiento  r. 

• x es  el  i-ésimo  objeto  en  el  agrupamiento  r. 

a.  Vinculación  individual,  también  llamado  vecino  más  cercano,  utiliza  la  menor  distancia  entre  dos  objetos 
en  los  dos  agrupamientos. 

c/(/\.v)  - min( í//A7(xn. , ), / E (í , rt, ), ./ G (l (AHI.  1 ) 


b.  Vinculación  completa,  también  llamado  vecino  más  lejano,  utiliza  la  mayor  distancia  entre  dos  objetos 
en  los  dos  agrupamientos. 

d{r,s)  » max(dist(xrí , x. ), i £ (/, , nr ),  j €E (1, .. ., ns ) (AHI. 2) 


c.  Vinculación  promedio,  utiliza  la  distancia  promedio  entre  todos  los  pares  de  objetos  en  cualquiera  de  los 
dos  agrupamientos. 


¿(r,s)  y y dist(xrí,xxJ) 


" frf  n 


(Allí. 3) 


d.  Vinculación  centroide,  utiliza  la  distancia  Euclídea  entre  los  centroides  de  los  dos  agrupamientos. 


-v  - 


donde  xr  - 


nr 


x*  y 


d(r,s)  -- 

se  refiere  a la  distancia  Euclídea. 


(ahí. 4) 


e.  Vinculación  media,  utiliza  la  distancia  Euclídea  entre  los  centroides  ponderados  de  los  dos  agrupamien- 
tos. 


d(r,s)  = 


*r  - 


(AHI. 5) 
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donde  xr  \ í son  los  centroides  pesados  para  los  agrupamientos  r y s.  Si  el  agrupamiento  r fue  creado  por 
la  combinación  de  los  agrupamientos  p v q,,r  es  definido  recursivamente  como  i 

1.  Vinculación  de  Ward,  utiliza  la  suma  incremental  de  los  cuadrados,  es  decir,  el  incremento  en  la  suma 
total  de  los  cuadrados  dentro  del  agrupamiento,  como  resultado  de  la  unión  de  dos  grupos.  La  suma  de  los 
cuadrados  dentro  del  agrupamiento  es  definida  como  la  suma  del  cuadrado  de  las  distancias  entre  todos  los 
objetos  en  el  agrupamiento  y el  centroide  del  agrupamiento.  La  distancia  equivalente  es: 


= nrns 


-V. 


(AI  1 1.6) 


('L+O 

g.  Promedio  ponderado  de  vinculación,  utiliza  una  definición  recursiva  para  la  distancia  entre  dos  agrupa- 
mientos. Si  el  agrupamiento  r fue  creado  mediante  la  combinación  de  los  agrupamientos  p y q,  la  distancia 
entre  r y otro  agrupamiento  s se  define  como  el  promedio  de  las  distancias  entre  p y s y la  distancia  entre 
q y s: 

( d(p,s)+d(q,s )) 

(Aiii. 7) 


d(r,s) 


IV.  Llirninación  de  Mínimos  Locales  y Descripción  del  Cálculo  Iterativo  en  el  Método  K-Medias. 
eliminación  de  mínimos  locales 

Al  igual  que  sucede  en  muchos  otros  problemas  de  optimización  numérica,  la  solución  que  se  alcanza  con 
el  método  K-Mcdias  depende  a menudo  del  punto  de  partida,  en  este  caso  la  posición  inicial  del  centroide 
de  cada  agrupamiento.  Es  posible  así  alcanzar  un  mínimo  local,  donde  la  reasignación  de  cualquier  punto  a 
un  nuevo  agrupamiento  debería  incrementar  la  suma  total  de  distancias  centroide-punto,  pero  donde  puede 
existir  realmente  una  mejor  solución.  Para  solucionar  este  problema,  es  posible  especificar  en  el  método  el 
número  de  'réplicas',  es  decir,  el  número  de  veces  en  que  se  repetirá  el  proceso  de  agrupación,  cada  uno  con 
un  nuevo  conjunto  de  posiciones  iniciales  del  centroide  del  agrupamiento.  Por  supuesto,  la  mejor  solución 
será  aquella  para  la  cual  la  suma  de  las  distancias  centroide-punto  para  cada  uno  de  los  agrupamientos  sea 
mínima. 

Descripción  del  algoritmo 


El  algoritmo  consta  de  dos  partes: 

Primera  fase.  Cada  iteración  consiste  en  la  reasignación  colectiva  de  elementos  al  centroide  del  agrupa- 
miento más  cercano,  todos  a la  vez.  seguida  de  un  nuevo  cálculo  de  Lis  posiciones  de  los  centroides.  La 
primera  fase  ocasionalmente  converge  a soluciones  que  son  un  mínimo  local;  es  más  probable  alcanzar  un 
mínimo  global  si  se  trabaja  con  pequeños  grupos  de  datos.  La  fase  de  actualización  colectiva  es  rápida,  pero 
posiblemente  sólo  aproxime  una  solución  que  sea  el  punto  de  partida  de  la  segunda  fase. 

Secunda  fase.  Los  elementos  son  reasignados  individualmente  si  con  ello  se  reduce  la  suma  de  distancias, 
v en  cada  reasignación  se  calcula  la  ubicación  del  centroide  del  agrupamiento.  Cada  iteración  consiste  en  la 
ubicación  de  tocios  los  elementos.  En  esta  fase  la  solución  converge  a un  mínimo  local,  aunque  puede  haber 
otro  mínimo  local  con  menor  suma  total  de  distancias.  Generalmente  el  problema  de  hallar  un  mínimo 
ej0bal  puede  ser  resulto  únicamente  por  medio  de  una  selección  exhaustiva  de  los  puntos  de  partida,  aunque 
la  utilización  de  varias  réplicas  con  puntos  de  partida  aleatorios  generalmente  converge  a una  solución  que 
es  un  mínimo  global. 
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V7.  Definición  del  Parámetro  Silueta 

La  definición  de  los  valores  silueta  es  la  siguiente:  dado  un  grupo  Gj  y un  objeto  / asignado  a éste,  la  disi- 
militud promedio  de  i para  todos  los  objetos  j en  G está  dada  por: 


a (i)  - ^ d(i,  Gl/  )¡  número  de  objetos  en  Gi 


( AV.  1 ) 


donde  d(i,C lt/ ) es  la  distancia  de  cada  objeto  i a cada  objeto  j en  Gr  La  menor  disimilitud  correspondiente 
a i respecto  a cualquier  otro  agrupamiento,  b(i),  también  es  calculada.  Si  / es  más  similar  a los  objetos  en  un 
grupo  G,  que  a los  del  grupo  G,,  entonces: 


/>(/)  = y d(L  G . . ) número  de  objetos  en  G, 


( AV.2) 


Por  lo  tanto,  el  valor  silueta  s(i)  definido  para  un  objeto  / es: 

s{i ) = [/?(/ ) - a( i) y max  |¿/{/ ), h( /)} 


(AV.3) 


donde  max  |«(>"),  £(/)}•  se  refiere  al  mayor  valor  entre  a(i)  y b(i). 


V I.  El  Clasificador  del  Método  K- Vecinos  Más  Cercanos 


Si  se  quiere  conocer  la  clase  a la  que  pertenece  un  objeto  dado,  entre  varias  clases  posibles,  se  introduce  el 
concepto  de  clasificador.  Un  clasificador  es  una  función  que  asigna  un  objeto  a una  clase  determinada,  para 
lo  cual  se  basa  en  el  conocimiento  de  sus  variables  atributo.  Existen  dos  tipos  de  clasificadores: 

• Paramétricos:  asumen  que  la  distribución  estadística  que  sigue  el  conjunto  de  variables  es  cono- 
cido, y trata  de  estimar  los  parámetros  de  dicha  distribución. 

• No-paramétricos:  no  asume  ninguna  distribución  en  particular.  El  clasificador  se  construye  úni- 
camente con  los  datos  del  conjunto  de  entrenamiento. 

Entre  los  clasificadores  no-paramétricos,  el  más  conocido  es  el  basado  en  el  método  K-vecinos  más  cerca- 
nos: si  K es  el  número  de  objetos  que  pertenecen  a la  clase  G(  entre  los  k vecinos  más  cercanos  al  objeto 
considerado  x,  la  probabilidad  a posteriori  P ( G(  | d)  (la  probabilidad  de  que  la  clase  sea  G;  cuando  .y  se 
describe  con  el  conjunto  de  variables  d ) se  estima  como  . 

K 

De  esta  manera,  el  clasificador  asigna  .v  a la  clase  más  frecuente  entre  sus  k vecinos  más  cercanos,  según 
una  cierta  medida  de  distancia. 


VII.  Algunos  Algoritmos  Utilizados  en  Matlab 

Algoritmo  clusterskmeans.m 

function  [Resultkmeans]  = clusterskmeans(p.tot.nclusters.percent) 

% INPUT: 

% p = experimental  property 

% tot  = data  matrix  with  pool  of  descriptors 
% nclusters  = number  of  clusters  to  be  created 

% percent  = percent  of  total  compounds  to  be  used  as  part  of  train  and 
% val  sets 

% OUTPUT: 

% Resultkmeans  = returns  in  each  row  in  the  following  order: 

% the  descriptor  number,  mean  silhouette  valué,  minimum  silhouette 

% valué,  rmse( train),  rmse(val),  rmse(test),  rmse ( train ) -mse ( val ) , 

% the  within-cluster  sums  of  point-to-centroid  distances,  the 

% sum  of  within-cluster  sums  of  point— to— centroid  distances , and 

% the  number  of  objects  in  each  cluster 

% Pablo  R.  Duchowicz 
% INIFTA,  La  Plata,  Argentina 
% Created:  2nd  March  2011 
warning  off 
res j=[ ] ; 

[di,  d2 ] =size { tot ) ; 
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for  j=l :d2 
apt=0 ; 
vecto=[ j ] ; 

[IDXQ,  C,  sumd,  D,  silh3,  msilh3,  ncomp ) = kmca ( tot (:, vecto ) , nclusters,  'distance',  'sqEuclid- 
ean',  'off',  50); 

if  msilh3==-999 
apt=l; 

else 

if  ms ilh3== 1 
apt=l ; 

else 

if  silh3>0 
apt=0 ; 

else 

apt=l; 

end 

end 

end 

if  apt==0 

res=sumd ' ; 

[Idmol  Ncomp j = idmol(IDX0,  nclusters); 
vari=0; 

for  k=l : nclusters 
if  Ncomp ( k ) ==0 
var i=l ; 

end 

end 

if  vari==0 

[train,  val,  test]  = analysis2 ( Idmol , percent ) ; 

(Res]  = rmsr( p( train ) , [1],  totO ( train, :) , 1); 

[r33train  rs3val  rsstest]  = trainvaltestrss (train, val, test ,p, totO, Res ( 2 )) ; 
re3]= ( res ] ; ( vecto , m3ilh3,min(silh3),Res(2),rsstrain,rss val, rsstest, abs ( rsst rain -rss val ) , 

( l-rsstrain/r33val ) * 100 , re 3 , sum( res ) , ncomp ] ] ; 
end 

end 

end 

if  size ( res j , 1 ) >0 

res  j = sortrows ( res j , (dv+9 ) ) ; 

end 

Resultkmeans=res]  ; 

Algoritmo  clustersknn.m 

function  [Resultknn]  = clustersknn ( p , tot , nclusters , percent ) 

% INPUT : 

% p = experimental  property 

% tot  = data  matrix  with  pool  of  descriptors 
% nclusters  = number  of  cluster3  to  be  created 

% percent  = percentaqe  of  total  compounds  to  be  used  as  part  of  train  and 
% val  sets 

% OUTPUT : 

% Resultknn  = returns  in  each  row  the  results  in  the  following  order: 

% the  classifying  descriptor 's  number,  the  best  descriptor  of 

% linear  model,  rmse(train),  rmse(val),  rmse(test),  rmse(train)- 

% rmse(val),  the  percentage  difference  between  train  and  val,  and 

% the  number  of  objects  in  each  cluster 

% Pablo  R.  Duchowicz 
% INIFTA,  La  Plata,  Argentina 
% Created:  15th  March  of  2011 
warning  off 
tes j =»  []; 

[di,  d2 ] = size(tot); 
for  j=l:d2 

vecto  = [ j ] ; 

[CN]  = centers ( tot( :, vecto) , nclusters ) ; 
c = knnclassif y ( tot ( : , vecto ) , CN , ( 1 : nclusters ) ' ) ; 

[Idmol  Ncomp]  = idmol (c,  nclusters); 
var i=0 ; 

for  k = l:nclusters 
if  Ncomp ( k ) ==0 
vari=l; 

end 

end 

if  vari  ==  0 

[train,  val,  te3t]  = analysis2 ( Idmol , percent ) ; 

[Res]  = rmsr ( p ( train ) , [1],  tot ( train ,:) , 1); 

[rsstrain  rs3val  rsstest]  = trainvaltestrss ( train , val , test , p, tot , Res ( 2 )) ; 

res j= [ res j ; (vecto, Res ( 2), rsst rain, rss val, rsstest , abs ( rsstrain-rssval ) , ( 1 -rss train/ 
rssval ) *100 , Ncomp ] ] ; 
end 

end 

if  3ize ( res j , 1 )>0 

res j=sortrows (res j , (dv+7) ); 

end 


Resultknn=res j ; 
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INSTRUCCIONES  PARA  LOS  AUTORES 

Las  siguientes  Instrucciones  pura  los  autores  constituyen  el  reglamento  de  publicaciones  de  los  ANALES  DE 
LA  SOCIEDAD  CIENTIFICA  ARGENTINA. 

I)  Generales 

Los  ANALES  DE  LA  SOCIEDAD  CIENTIFCA  ARGENTINA  constituyen  una  revista  multidisciplinaria. 
1 lindada  en  1876,  que  considera  para  su  publicación  trabajos  de  cualquier  área  de  la  ciencia. 

Los  originales  deben  ser  enviados  al  director,  a Av.  Santa  Fe  1145,  Buenos  Aires,  CP.:  1059.  República  Argen- 
tina, en  tres  copias  en  papel,  a dos  espacios,  tamaño  carta,  acompañados  de  su  correspondiente  disquete.  Los  disquetes 
deberán  estar  rotulados  con  el  nombre  del  autor  o del  primer  autor  si  son  varios  haciendo  constar  el  sistema  compulacionai 
usado  para  grabar  el  mismo,  el  tipo  y versión  del  procesador  utilizado  y nombres  de  los  archivos. 

Los  autores  serán  notificados  de  inmediato  de  la  recepción  de  sus  originales.  Dicha  notificación  no  implica  la 
aceptación  del  trabajo.  Los  originales  son  enviados  a uno  o más  arbitros,  quienes  asesoran  al  director  y a la  comisión  de 
redacción  acerca  de  la  aceptación,  rechazo  o sugerencia  de  modificaciones.  La  decisión  final  respecto  a la  publicación  o 
no  del  trabajo  es  solamente  responsabilidad  del  director. 

Los  originales  remitidos  para  su  publicación  en  los  ANALES  deben  ser  inéditos  y no  hallarse  en  análisis  para 
su  publicación  en  otra  revista  o cualquier  otro  medio  editorial. 

Todo  trabajo  aceptado  en  los  ANALES  no  podrá  ser  publicado  en  otro  medio  gráfico  sin  previo  consentimiento 
de  la  dirección. 

Los  ANALES  se  reservan  el  dercho  de  rechazar  sin  más  trámite  a aquellos  originales  que  no  se  ajusten  a las 
normas  expuestas  en  la  presente  guia  de  Instrucciones  para  los  autores. 


Los  ANALES  constan  de  las  siguientes  secciones: 


-artículos  de  investigación 

-notas  breves  de  investigación 

-artículos  de  revisión  y/o  actualización 

-editoriales 

-recensiones 

-cartas  a la  dirección 

-informaciones  del  quehacer  de  la  SOCIEDAD  CIENTIFICA  ARGENTINA 
-informaciones  científicas  y acádemicas  de  interés  general 

Los  autores,  al  remitir  sus  trabajos,  deberán  hacer  constar  la  sección,  a la  que  según  su  juicio,  corresponden 
sus  aportes  y consignar  claramente  la  dirección  postal,  teléfono,  fax  y dirección  electrónica  (si  la  tuviere)  a la  cual  se 
remitirá  toda  información  corcemente  al  original. 


2)  Originales 


Los  ANALES  DE  LA  SOCIEDAD  CIENTIFICA  ARGENTINA  publicarán  trabajos  escritos  en  los  idiomas: 
español,  francés,  inglés  y portugués. 

Los  originales  deberán  respetar  la  siguiente  estructura: 


Ia  pagina: 

-Título  del  trabajo:  no  mayor  de  veinticinco  (25)  palabras 
-Nómina  de  los  autores,  institución  o instituciones  a la  que  pertenecen  cada  uno 
de  ellos. 

-Institución  en  la  que  se  llevó  a cabo  el  trabajo  en  el  caso  que  difiera  de  la  institución 
de  pertenencia. 

-Domicilio  postal  y electrónico  (si  lo  tuviere) 

2a  página: 

-Resumen  en  idioma  español  de  no  más  de  400  palabras,  con  su  correspondiente 
traducción  al  inglés.  La  traducción  al  inglés  deberá  incluir  el  título  del  trabajo  cuando 
éste  haya  sido  escrito  en  español  y viceversa,  si  el  trabajo  se  halla  escrito  en  inglés 
el  resumen  en  español  deberá  incluir  la  traducción  del  título. 

-La  inclusión  de  resúmenes  en  francés  y portugués  es  facultativa  de  los  autores. 
-Palabras  claves  para  el  registro  bibliogáfico  e inserción  en  bases  de  datos,  en 
español  e inglés. 


L 
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hn  las  páginas  siguientes  se  incluirán  las  secciones  Introducción.  Materiales  y Métodos.  Resultados.  Discusión. 
Agradecimientos  y Reterencias.  A continuación  se  agregaran  las  tablas  con  sus  títulos,  leyendas  de  las  figuras  y gráficos 
y finalmente  las  figuras  y gráficos  preparados  como  se  indica  más  abajo. 

hl  ti  pe  ado  del  manuscrito  deberá  hacerse  a doble  espacio  en  papel  tamaño  carta  (apro\.  2 ! cm  x 29cm),  dejando 
o cm  de  márgenes  izquierdo,  superior  e inferior,  debiéndose  numerar  secuencialmente  todas  las  páginas. 

No  se  aceptará  la  inserción  de  notas  de  pie  de  página.  Cuando  ello  sea  necesario,  se  deberá  incluir  tales  notas 
en  el  mismo  texto. 

Se  recomienda  emplear  el  Sistema  Métrico  Decimal  de  medidas  y las  abreviaturas  universales  estándar. 

Solo  se  permitirá  el  empleo  del  Sistema  Internacional  de  Unidades  para  las  medidas. 

Como  regla  general  no  se  deberá  repetir  la  misma  información  en  tablas,  figuras  y texto.  Salvo  en  casos  especiales 
que  justifiquen  alguna  excepción  se  aceptará  presentar  esencialmente  la  misma  la  información  en  dos  formas  simultáneas. 

Cada  sección  se  numerará  consecutivamente,  recomendándose  no  emplear  subsecciones. 


3)  Tablas 


l as  tablas  deben  prepararse  en  hojas  aparte  y a doble  espacio.  Las  mismas  incluirán  un  título  suficientemente 
aclaratorio  de  ->u  contenido  y se  indicarán  en  el  texto  su  ubicación,  señalándolo  con  un  lápiz  sobre  el  margen  izquierdo. 

Cada  tabla  se  numerará  consecutivamente  con  números  arábigos.  Solo  se  deberá  incluir  en  las  tablas  información 
significativa,  debiéndose  evitar  todo  dato  accesorio  y/o  que  pueda  ser  mejor  informado  en  el  mismo  texto  del  trabajo. 

Cada  tabla  se  ripeará  en  hoja  separada. 

L.os  títulos  de  las  filas  y las  columnas  deben  ser  lo  suficientemente  explícitos  y consistentes,  pero  al  mismo 
tiempo  se  recomienda  concisión  en  su  preparación. 

4)  Ilustraciones 

Las  ilustraciones  (gráficos  y fotografías)  deberán  ser  de  suficiente  calidad  tal  que  permitan  una  adecuada 
reproducción  debiéndose  tener  en  cuenta  que  la  reproducción  directa  de  los  mismos  conlleva  una  relación  entre  1:2  y 
1 :3.  Todas  las  ilustraciones  se  numerarán  consecutivamente  y en  el  reverso  de  las  mismas  se  indicarán  con  lápiz  blando 
el  nombre  de  los  autores,  el  número  de  la  misma  y cuando  corresponda  la  orientación  para  su  pertinente  impresión. 

I .os  títulos  de  las  ilustraciones  se  ripearán  en  hoja  aparte,  debiéndose  denotar  el  posicionado  de  bus  mismas  en 
el  texto  por  medio  de  una  indicación  con  lápiz  en  el  margen  izquierdo. 

I as  dimensiones  de  las  ilustraciones  no  deberán  exceder  las  de  las  hojas  del  manuscrito  y no  se  deberán  doblar. 

Los  gráficos  se  dibujarán  con  tinta  china  sobre  papel  vegetal  de  buena  calidad  y por  los  mismos  medios  se 
incluirán  los  símbolos,  letras  y números  correspondientes.  No  se  deberá  ripear  símbolo,  letra  o número  alguno  en  los 
gráficos  y fotografías. 

Enviar  un  original  y dos  copias  de  cada  ilustración.  Las  fotografías  solo  se  podrán  enviar  en  blanco  y negro, 
ya  que  que  no  es  posible  imprimir  fotografías  en  otros  colores. 

Cada  ilustración  se  presentará  en  hoja  separada. 

5)  Referencias 

Los  ANALES  adoptan  el  sistema  de  referencias  por  orden,  el  cual  consiste  en  citar  los  trabajos  en  el  orden 
que  aparecen  por  medio  de  número  cardinal  correspondiente.  Los  libros  se  indicarán  en  la  lista  de  referencias  citando 
el/los  autores,  título,  edición,  editorial . ciudad,  año  y página  inicial.  Para  indicar  capítulo  de  libro  se  añadirá  a lo  anterior 
el  título  del  mismo  y el  nombre  del  editor 

F.I  listado  de  referencias  se  ripeará  en  hoja  separada  y a doble  espacio.  Se  recomienda  especialmente  a los 
autores  emplear  las  abreviaturas  estándar  sugeridas  por  las  propias  fuentes. 

Solo  se  admitirán  citas  de  publicaciones  válidas  y asequibles  a los  lectores  por  los  medios  normales  debiéndose 
evitar  recurrir  a informes  personales,  tesis,  monografías,  trabjos  en  prensa,  etc.,  de  circulación  restringida. 

Lo  que  si¿ue  son  algunos  ejemplos  de  citas  bibliográficas  en  la  lista  de  referencia: 

Publicación  periódica  A.  M.  Sierra  y F.  S.  González.  J.  Chem.  Phys.  63  ( 1977)  512. 

Libro:  R.  A..  Day.  How  to  write  and  publish  a Scientific  paper.  Second  Edition,  ISI  Press.  Philadelphia,  1983,  p 35. 

Capitulo  del  libro:  Z.  Kaszbab.  Family  Tenebrionodae  en  W.  Wittmer  and  Buttiper  (Eds.)  Famma  of  Saudi 
Arabia.  Ciba-Geigy.  Basel.  1981,  p3- 15. 

Conferencia  o Simposio:  A.  Ernest.  Energy  conservation  mensures  in  Kuwait  buildings.  Proccedings  of  the  First 
Symposium  on  Thermal  Insulation  in  the  Gulf  States,  Kuwait  Institute  for  Scientific  Research.  Kuwait,  1975.  p 151 . 

Se  recomienda  revisar  cuidadosamente  las  citas  en  el  texto  y la  lista  de  referencias  a los  efectos  de  evitar 
inconsistencias  y/u  omisiones. 

Pruebas:  todo  artículo  deberá  ser  revisado  en  la  forma  de  prueba  de  galera  por  el  autor  indicado  en  la  carta 
de  presentación  del  trabajo,  la  cual  se  devolverá  debidamente  corregida  a las  72  horas  de  recibida  a la  redacción  de  los 
ANALES.  No  se  adrnitrá  en  forma  alguna  alteración  sustancial  del  texto  y en  caso  imprescindible  se  procederá  a la 
inclusión  al  final  del  trabajo  de  lo  que  correspondiera  bajo  el  título  de  “ Nota  agregada  en  la  prueba". 
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